pandas通过agg函数对DataFrame进行聚合操作
在 pandas 中,agg() 函数通常用于对 DataFrame 或 Series 进行聚合操作。它允许您对数据进行聚合,并且可以使用多个聚合函数一次性对数据进行处理。
下面是一个示例,演示如何使用 agg() 函数计算 DataFrame 中不同列的多个聚合值:
import pandas as pd data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}) aggregated_data = data.agg({'A': ['sum', 'mean'], 'B': ['max', 'min'], 'C': ['std', 'var']})
在上面的示例中,我们使用 agg() 函数计算了 DataFrame data 的不同列的多个聚合值。{'A': ['sum', 'mean'], 'B': ['max', 'min'], 'C': ['std', 'var']} 字典指定了每列要计算的聚合函数。结果是一个包含每列聚合结果的 DataFrame。
您还可以使用 agg() 函数在 DataFrame 的不同列之间执行自定义聚合操作。例如,如果您想计算两列的差,可以使用以下代码:
aggregated_data = data.agg(lambda x: x['A'] - x['B'], axis=1)
在这个示例中,我们使用 agg() 函数在 DataFrame 的不同列之间执行自定义聚合操作。lambda x: x['A'] - x['B'] 表示计算 A 列和 B 列之间的差。结果是一个包含每个行的差值的 Series。
需要注意的是,agg() 函数还可以与 groupby() 函数一起使用,以对分组的数据进行聚合操作。
相关文章