获取列中值的计数并在绘图中显示其百分比

2022-03-02 00:00:00 python pandas data-science data-analysis

问题描述

如何计算列中值​​的频率并计算相对于总数的百分比?

我收到一个数据帧:

   range
0   G-L
1   M-R
2   G-L
3   M-R
4   A-F
5   S-Z
6   A-F
..   ..
..   ..

在df.range.value_Counts()之后,我得到以下信息:

A-F    1882
G-L    3096
M-R    3830
S-Z    1017
现在,我想要获取每个范围相对于总和的百分比,并将其显示在图表中,其中x轴获得了范围(A-F;G-L;.)和y轴显示这些范围的百分比。


解决方案

假设这是您的DataFrame

data = {'labels': ["A-F", "G-L", "M-R", "S-Z"], 'count':[1882, 3096, 3830, 1017]}
df = pd.DataFrame.from_dict(data)

print(df)

  labels  count
0    A-F   1882
1    G-L   3096
2    M-R   3830
3    S-Z   1017

现在您必须计算每行的百分比:

df['percentage'] = (df['count'] / df['count'].sum()) * 100

print(df)

  labels  count  percentage
0    A-F   1882   19.155216
1    G-L   3096   31.511450
2    M-R   3830   38.982188
3    S-Z   1017   10.351145

,然后使用df.plot()函数绘制标签与百分比的关系图,并指定其kind,我假设这是条形图。

df.plot(kind='bar', x='labels', y='percentage')

这将生成以下绘图:

编辑: value_counts()方法返回pd.Series()对象。要绘制它,您可以运行以下行:

df.range.value_counts(normalize=True).plot(kind='bar')

相关文章