海运HISPLOT和DISPLOT输出不匹配
问题描述
seaborn.histplot
和seaborn.displot
生成的直方图不匹配。sns.displot
的默认绘图为kind='hist'
- 使用
python3.8.11
、seaborn 0.11.2
和matplotlib 3.4.2
测试
- 为什么输出不匹配,如何解决此问题?
- 期望是,给定
bins
,相应曲线图的density
应该匹配。bins
传递给numpy.histogram_bin_edges
- Visualizing distributions of data中包含的信息不能解决问题。
import seaborn as sns
import matplotlib.pyplot as plt
# sample data: wide
dfw = sns.load_dataset("penguins", cache=False)[['bill_length_mm', 'bill_depth_mm']].dropna()
# sample data: long
dfl = dfw.melt(var_name='bill_size', value_name='vals')
seaborn.displot
- 忽略
'sharex': False
,但'sharey'
工作 - 忽略
bins
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
plt.show()
- 设置
xlim
没有影响
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
axes = fg.axes.ravel()
axes[0].set_xlim(25, 65)
axes[1].set_xlim(13, 26)
plt.show()
seaborn.histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.tight_layout()
plt.show()
更新
- 按照mwaskom的建议,
common_bins=False
使直方图形状一致,解决了忽略bins
和sharex
的问题。但是,density
似乎受到displot
中绘图数量的影响。- 如果
displot
中有3个地块,则密度为histplot
中的1/3;2个地块,密度为1/2。
- 如果
解决方案
- 按照mwaskom在评论中的建议,
common_bins=False
将直方图调整为相同的形状,解决了忽略bins
和sharex
的问题,并且分面图中的density
是根据每个分面中的数据点的数量而不是分面的数量进行缩放的。 density
按displot
中的绘图数量拆分的问题通过使用common_norm=False
解决
打印代码
# displot
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4,
facet_kws={'sharey': False, 'sharex': False}, common_bins=False, common_norm=False)
fg.fig.subplots_adjust(top=0.85)
fg.fig.suptitle('Displot with common_bins & common_norm as False')
plt.show()
# histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.subplots_adjust(top=0.85)
fig.suptitle('Histplot')
fig.tight_layout()
plt.show()
相关文章