pandas通过agg函数对DataFrame进行聚合操作

2023-02-23 00:00:00 函数 操作 聚合

在 pandas 中,agg() 函数通常用于对 DataFrame 或 Series 进行聚合操作。它允许您对数据进行聚合,并且可以使用多个聚合函数一次性对数据进行处理。

下面是一个示例,演示如何使用 agg() 函数计算 DataFrame 中不同列的多个聚合值:

import pandas as pd

data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

aggregated_data = data.agg({'A': ['sum', 'mean'], 'B': ['max', 'min'], 'C': ['std', 'var']})

在上面的示例中,我们使用 agg() 函数计算了 DataFrame data 的不同列的多个聚合值。{'A': ['sum', 'mean'], 'B': ['max', 'min'], 'C': ['std', 'var']} 字典指定了每列要计算的聚合函数。结果是一个包含每列聚合结果的 DataFrame。

您还可以使用 agg() 函数在 DataFrame 的不同列之间执行自定义聚合操作。例如,如果您想计算两列的差,可以使用以下代码:

aggregated_data = data.agg(lambda x: x['A'] - x['B'], axis=1)

在这个示例中,我们使用 agg() 函数在 DataFrame 的不同列之间执行自定义聚合操作。lambda x: x['A'] - x['B'] 表示计算 A 列和 B 列之间的差。结果是一个包含每个行的差值的 Series。

需要注意的是,agg() 函数还可以与 groupby() 函数一起使用,以对分组的数据进行聚合操作。

相关文章