如何利用 pandas 数据框架构建人口金字塔
问题描述
如何根据以下起始数据框绘制人口金字塔?
Age Gender Count
0 50-45 years male 4
1 50-45 years female 5
2 55-65 years male 6
3 55-65 years female 7
4 65-70 years male 11
5 65-70 years female 12
我尝试了以下方法,Population Pyramid with Python and Seaborn,但是结果图看起来很奇怪:
import pnadas as pd
import seaborn as sns
# data
data = {'Age': ['50-45 years', '50-45 years', '55-65 years', '55-65 years', '65-70 years', '65-70 years'],
'Gender': ['male', 'female', 'male', 'female', 'male', 'female'], 'Count': [4, 5, 6, 7, 11, 12]}
df = pd.DataFrame(data)
# plot
sns.barplot(data=df, x='Count', y='Age',
hue='Gender', orient='horizontal',
dodge=False)
我认为问题在于我的年龄是一个字符串。
解决方案
- 与链接问题不同,两个
'Gender'
组的'Count'
都是正数,因此使用dodge=False
时,'Female'
条形图绘制在'Male'
条形图的顶部。 - 使用
.loc
和布尔选择将其中一个组转换为负值。
# convert male counts to negative
df.loc[df.Gender.eq('male'), 'Count'] = df.Count.mul(-1)
# plot
sns.barplot(data=df, x='Count', y='Age', hue='Gender', orient='horizontal', dodge=False)
相关文章