如何使用 Python 筛选 Excel 数据透视表

简介

数据透视表是Excel中一种高效、灵活的数据分析工具，它能够快速汇总大量信息，帮助用户深入挖掘数据的价值并生成直观的报告。在数据透视表的众多功能中，筛选功能尤为重要，它允许用户精准聚焦特定数据子集，且无需对原始数据做任何修改，从而保障数据的完整性和准确性。

本教程涵盖的内容

本教程介绍如何使用 Python 和 Spire.XLS for Python 库，以编程方式对 Excel 数据透视表应用多种筛选器。主要内容包括：

为什么需要对数据透视表进行筛选
安装 Python Excel 库——Spire.XLS for Python
向数据透视表添加报表筛选器
在数据透视表中应用行字段筛选器
在数据透视表中应用列字段筛选器
总结

为什么需要对数据透视表进行筛选？

筛选是数据透视表中不可或缺的功能，它拥有诸多优势：

提升数据分析效率：快速锁定特定的数据区域或类别，帮助挖掘更具价值的信息。
实现动态更新：当底层数据更新时，筛选条件会自动调整，保证分析结果始终准确可靠。
优化数据展示：只显示与分析相关的数据内容，避免修改或删除原始数据，确保数据的完整性和安全性。

安装 Python Excel 库——Spire.XLS for Python

在使用 Python 操作 Excel 数据透视表前，请先安装 Spire.XLS for Python 库。

最快捷的安装方式是通过 pip（Python 包管理器），你只需要在终端或命令提示符中输入以下命令，即可安装Spire.XLS for Python：

pip install spire.xls

向数据透视表添加报表筛选器

报表筛选器允许用户根据指定字段和值对整个数据透视表进行全局筛选。它适用于在不改变表格布局的情况下，仅显示特定类别或项目的数据。

添加报表筛选器的步骤

初始化工作簿：创建 Workbook 类的对象以处理 Excel 文件。
加载 Excel 文件：使用 Workbook.LoadFromFile() 加载包含数据透视表的现有文件。
访问工作表：使用 Workbook.Worksheets[] 选择目标工作表。
定位数据透视表：使用 Worksheet.PivotTables[] 访问指定的数据透视表。
定义报表筛选器：创建 PivotReportFilter 对象并指定筛选字段。
应用报表筛选：使用 XlsPivotTable.ReportFilters.Add() 将筛选器添加到数据透视表。
保存更新的文件：使用 Workbook.SaveToFile() 保存更改。

代码示例

Python

from spire.xls import *

# 创建 Workbook 类的对象
workbook = Workbook()

# 加载 Excel 文件
workbook.LoadFromFile("示例.xlsx")

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# 获取工作表中的第一个数据透视表
pt = sheet.PivotTables[0]

# 为"产品" 字段创建报表筛选器
reportFilter = PivotReportFilter("产品", True)

# 将报表筛选器添加到数据透视表
pt.ReportFilters.Add(reportFilter)

# 保存结果文件
workbook.SaveToFile("报表筛选器.xlsx", FileFormat.Version2016)
workbook.Dispose()

在数据透视表中应用行字段筛选器

行字段筛选器允许用户筛选显示在 Excel 数据透视表行字段中的数据。这些筛选可以基于标签（特定文本值）或数值。

添加行字段筛选器的步骤

初始化工作簿：创建 Workbook 对象以处理 Excel 文件。
加载 Excel 文件：使用 Workbook.LoadFromFile() 加载目标文件。
访问工作表：使用 Workbook.Worksheets[] 选择目标工作表。
定位数据透视表：使用 Worksheet.PivotTables[] 访问指定数据透视表。
添加行字段筛选器：使用 XlsPivotTable.RowFields[].AddLabelFilter() 或 XlsPivotTable.RowFields[].AddValueFilter() 为特定行字段添加标签筛选器或数值筛选器。
计算数据透视表数据：使用 XlsPivotTable.CalculateData() 刷新筛选后的数据。
保存更新的文件：使用 Workbook.SaveToFile() 保存更改。

代码示例

Python

from spire.xls import *

# 创建 Workbook 类的对象
workbook = Workbook()

# 加载 Excel 文件
workbook.LoadFromFile("示例.xlsx")

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# 获取第一个数据透视表
pt = sheet.PivotTables[0]

# 向第一个行字段添加数值筛选器（筛选条件：大于 5000）
pt.RowFields[0].AddValueFilter(PivotValueFilterType.GreaterThan, pt.DataFields[0], Int32(5000), None)

# 或者向第一个行字段添加标签筛选器（筛选条件：等于 "张超"）
# pt.RowFields[0].AddLabelFilter(PivotLabelFilterType.Equal, "张超", None)

# 计算数据透视表数据
pt.CalculateData()

# 保存结果文件
workbook.SaveToFile("行字段筛选器.xlsx", FileFormat.Version2016)
workbook.Dispose()

在数据透视表中应用列字段筛选器

列字段筛选器可以让用户筛选数据透视表中列字段的数据。与行字段筛选器类似，列字段筛选既可以基于标签（文本）进行，也可以基于数值条件来设置。

添加列字段筛选器的步骤

初始化工作簿：创建 Workbook 对象。
加载 Excel 文件：使用 Workbook.LoadFromFile() 打开文件。
访问工作表：使用 Workbook.Worksheets[] 选择目标工作表。
定位数据透视表：使用 Worksheet.PivotTables[] 访问目标数据透视表。
添加列字段筛选器：使用 XlsPivotTable.ColumnFields[].AddLabelFilter() 或 XlsPivotTable.ColumnFields[].AddValueFilter()为特定列字段添加标签筛选器或数值筛选器。
计算数据透视表数据：使用 XlsPivotTable.CalculateData() 刷新筛选数据。
保存更新的文件：使用 Workbook.SaveToFile()。

代码示例

Python

from spire.xls import *

# 创建 Workbook 类的对象
workbook = Workbook()

# 加载 Excel 文件
workbook.LoadFromFile("示例.xlsx")

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# 获取第一个数据透视表
pt = sheet.PivotTables[0]

# 给第一个列字段添加标签筛选器
pt.ColumnFields[0].AddLabelFilter(PivotLabelFilterType.Equal, String("笔记本电脑"), None)

# 如果想应用数值筛选，参考下面这行代码
# pt.ColumnFields[0].AddValueFilter(PivotValueFilterType.Between, pt.DataFields[0], Int32(5000), Int32(10000))

# 计算数据透视表数据
pt.CalculateData()

# 保存结果文件
workbook.SaveToFile("列字段筛选器.xlsx", FileFormat.Version2016)
workbook.Dispose()

申请临时 License

如果您需要去除生成文档中的评估提示或解除功能限制，请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。

总结

在 Excel 中，筛选数据透视表是实现高效数据分析的关键，它帮助用户聚焦重要信息，同时保持表格结构不变。借助 Spire.XLS for Python，开发者可以轻松通过编程自动化添加、修改和管理数据透视表的筛选条件，提高工作效率。