具有GROUPBY的多列上的VALUE_COUNTS
问题描述
我需要一些 pandas 方面的帮助。
我有以下数据帧:
df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'],
'2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','Paris','Berlin','Rome'],
'F1': ['A', 'B', 'C', 'B', 'B', 'C', 'A', 'B', 'C'],
'F2': ['B', 'C', 'A', 'A', 'B', 'C', 'A', 'B', 'C'],
'F3': ['C', 'A', 'B', 'C', 'C', 'C', 'A', 'B', 'C']})
screenshot
我正在尝试对前两列1Country
和2City
执行groupby
,对列F1
和F2
执行value_counts
。到目前为止,我使用一次只能对一个列执行GROUPBY ANDvalue_counts
df.groupby(['1Country','2City'])['F1'].apply(pd.Series.value_counts)
如何对多列执行value_counts
并获得数据框结果?
解决方案
您可以使用agg
,内容大致如下:
df.groupby(['1Country','2City']).agg({i:'value_counts' for i in df.columns[2:]})
F1 F2 F3
FR Paris A 2.0 1.0 2.0
B 1.0 1.0 NaN
C NaN 1.0 1.0
GER Berlin A NaN 2.0 NaN
B 2.0 1.0 2.0
C 1.0 NaN 1.0
IT Rome B 1.0 1.0 NaN
C 2.0 2.0 3.0
相关文章