获取列中值的计数并在绘图中显示其百分比
问题描述
如何计算列中值的频率并计算相对于总数的百分比?
我收到一个数据帧:
range
0 G-L
1 M-R
2 G-L
3 M-R
4 A-F
5 S-Z
6 A-F
.. ..
.. ..
在df.range.value_Counts()之后,我得到以下信息:
A-F 1882
G-L 3096
M-R 3830
S-Z 1017
现在,我想要获取每个范围相对于总和的百分比,并将其显示在图表中,其中x轴获得了范围(A-F;G-L;.)和y轴显示这些范围的百分比。
解决方案
假设这是您的DataFrame
:
data = {'labels': ["A-F", "G-L", "M-R", "S-Z"], 'count':[1882, 3096, 3830, 1017]}
df = pd.DataFrame.from_dict(data)
print(df)
labels count
0 A-F 1882
1 G-L 3096
2 M-R 3830
3 S-Z 1017
现在您必须计算每行的百分比:
df['percentage'] = (df['count'] / df['count'].sum()) * 100
print(df)
labels count percentage
0 A-F 1882 19.155216
1 G-L 3096 31.511450
2 M-R 3830 38.982188
3 S-Z 1017 10.351145
,然后使用df.plot()
函数绘制标签与百分比的关系图,并指定其kind
,我假设这是条形图。
df.plot(kind='bar', x='labels', y='percentage')
这将生成以下绘图:
编辑:
value_counts()
方法返回pd.Series()
对象。要绘制它,您可以运行以下行:
df.range.value_counts(normalize=True).plot(kind='bar')
相关文章