Pandas对数据进行分组并统计每个分组中元素的行数

2023-02-24 00:00:00 分组 行数 组中

在 pandas 中,可以使用 groupby() 方法对 DataFrame 进行分组操作,并可以使用 count() 方法对每个分组中的元素进行计数。

例如,假设有一个 DataFrame df,其中包含两列数据:A 和 B。要对 df 根据列 A 进行分组并计算每个分组中的元素个数,可以使用以下代码:

grouped_df = df.groupby('A').count()

这将返回一个新的 DataFrame grouped_df,其中包含每个不同值的计数。grouped_df 的索引将设置为列 A 的唯一值,而计数将在列 B 中返回。可以使用以下代码查看 grouped_df 的前几行:

print(grouped_df.head())

如果需要计算多列数据的计数,则可以在 count() 方法中指定列的名称,例如:

grouped_df = df.groupby('A')['B', 'C'].count()

这将根据列 A 进行分组,并计算每个分组中列 B 和 C 的元素个数。

相关文章