海运HISPLOT和DISPLOT输出不匹配

问题描述

  • seaborn.histplotseaborn.displot生成的直方图不匹配。
    • sns.displot的默认绘图为kind='hist'
  • 使用python3.8.11seaborn 0.11.2matplotlib 3.4.2
  • 测试
  • 为什么输出不匹配,如何解决此问题?
  • 期望是,给定bins,相应曲线图的density应该匹配。
    • bins传递给numpy.histogram_bin_edges
  • Visualizing distributions of data中包含的信息不能解决问题。
import seaborn as sns
import matplotlib.pyplot as plt

# sample data: wide
dfw = sns.load_dataset("penguins", cache=False)[['bill_length_mm', 'bill_depth_mm']].dropna()

# sample data: long
dfl = dfw.melt(var_name='bill_size', value_name='vals')

seaborn.displot

  1. 忽略'sharex': False,但'sharey'工作
  2. 忽略bins
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
plt.show()

  1. 设置xlim没有影响
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
axes = fg.axes.ravel()
axes[0].set_xlim(25, 65)
axes[1].set_xlim(13, 26)
plt.show()

seaborn.histplot

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))

sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.tight_layout()
plt.show()

更新

  • 按照mwaskom的建议,common_bins=False使直方图形状一致,解决了忽略binssharex的问题。但是,density似乎受到displot中绘图数量的影响。
    • 如果displot中有3个地块,则密度为histplot中的1/3;2个地块,密度为1/2。


解决方案

  • 按照mwaskom在评论中的建议,common_bins=False将直方图调整为相同的形状,解决了忽略binssharex的问题,并且分面图中的density是根据每个分面中的数据点的数量而不是分面的数量进行缩放的。
  • densitydisplot中的绘图数量拆分的问题通过使用common_norm=False
  • 解决

打印代码

# displot
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4,
                 facet_kws={'sharey': False, 'sharex': False}, common_bins=False, common_norm=False)

fg.fig.subplots_adjust(top=0.85)
fg.fig.suptitle('Displot with common_bins & common_norm as False')
plt.show()

# histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))

sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)

fig.subplots_adjust(top=0.85)
fig.suptitle('Histplot')

fig.tight_layout()
plt.show()

相关文章