Pandas对数据进行分组并统计每个分组中元素的行数
在 pandas 中,可以使用 groupby() 方法对 DataFrame 进行分组操作,并可以使用 count() 方法对每个分组中的元素进行计数。
例如,假设有一个 DataFrame df,其中包含两列数据:A 和 B。要对 df 根据列 A 进行分组并计算每个分组中的元素个数,可以使用以下代码:
grouped_df = df.groupby('A').count()
这将返回一个新的 DataFrame grouped_df,其中包含每个不同值的计数。grouped_df 的索引将设置为列 A 的唯一值,而计数将在列 B 中返回。可以使用以下代码查看 grouped_df 的前几行:
print(grouped_df.head())
如果需要计算多列数据的计数,则可以在 count() 方法中指定列的名称,例如:
grouped_df = df.groupby('A')['B', 'C'].count()
这将根据列 A 进行分组,并计算每个分组中列 B 和 C 的元素个数。
相关文章