具有GROUPBY的多列上的VALUE_COUNTS

2022-02-26 00:00:00 python pandas pandas-groupby

问题描述

我需要一些 pandas 方面的帮助。

我有以下数据帧:

df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'],
               '2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','Paris','Berlin','Rome'],
               'F1': ['A', 'B', 'C', 'B', 'B', 'C', 'A', 'B', 'C'],
               'F2': ['B', 'C', 'A', 'A', 'B', 'C', 'A', 'B', 'C'],
               'F3': ['C', 'A', 'B', 'C', 'C', 'C', 'A', 'B', 'C']})

screenshot

我正在尝试对前两列1Country2City执行groupby,对列F1F2执行value_counts。到目前为止,我使用

一次只能对一个列执行GROUPBY ANDvalue_counts
df.groupby(['1Country','2City'])['F1'].apply(pd.Series.value_counts)

如何对多列执行value_counts并获得数据框结果?


解决方案

您可以使用agg,内容大致如下:

df.groupby(['1Country','2City']).agg({i:'value_counts' for i in df.columns[2:]})

               F1   F2   F3
FR  Paris  A  2.0  1.0  2.0
           B  1.0  1.0  NaN
           C  NaN  1.0  1.0
GER Berlin A  NaN  2.0  NaN
           B  2.0  1.0  2.0
           C  1.0  NaN  1.0
IT  Rome   B  1.0  1.0  NaN
           C  2.0  2.0  3.0

相关文章