如何利用 pandas 数据框架构建人口金字塔

2022-02-27 00:00:00 python pandas matplotlib seaborn bar-chart

问题描述

如何根据以下起始数据框绘制人口金字塔?

           Age  Gender  Count
0  50-45 years    male      4
1  50-45 years  female      5
2  55-65 years    male      6
3  55-65 years  female      7
4  65-70 years    male     11
5  65-70 years  female     12

我尝试了以下方法,Population Pyramid with Python and Seaborn,但是结果图看起来很奇怪:

import pnadas as pd
import seaborn as sns

# data
data = {'Age': ['50-45 years', '50-45 years', '55-65 years', '55-65 years', '65-70 years', '65-70 years'],
        'Gender': ['male', 'female', 'male', 'female', 'male', 'female'], 'Count': [4, 5, 6, 7, 11, 12]}

df = pd.DataFrame(data)

# plot
sns.barplot(data=df, x='Count', y='Age',
            hue='Gender', orient='horizontal', 
            dodge=False)

我认为问题在于我的年龄是一个字符串。


解决方案

  • 与链接问题不同,两个'Gender'组的'Count'都是正数,因此使用dodge=False时,'Female'条形图绘制在'Male'条形图的顶部。
  • 使用.loc和布尔选择将其中一个组转换为负值。
# convert male counts to negative
df.loc[df.Gender.eq('male'), 'Count'] = df.Count.mul(-1)

# plot
sns.barplot(data=df, x='Count', y='Age', hue='Gender', orient='horizontal', dodge=False)

相关文章