如何使用python matplotlib绘制正态分布的直方图?
问题描述
我的问题是-使用NumPy函数np.随机性.randn为100,000个点的正态分布生成数据x。然后绘制直方图。我的计算是-
x = sp.norm.pdf(np.random.randn(100000))
plt.hist(x, bins = 20, facecolor='blue', alpha=0.5)
是否有问题,因为我无法获得正态分布的直方图?
解决方案
要从标准正态分布中获得N个随机样本,您可以使用np.random.randn(N)
或Scipy的stats.norm.rvs(size=N)
。然后可以使用这些样本创建直方图。
要绘制曲线,可以使用stats.norm.pdf(y)
,其中y
是后续x值的数组。这样的pdf
是标准化的,即绘图下的面积是1。直方图的总面积是样本数乘以箱的宽度(每个样本正好落在一个箱中)。因此,将pdf与该因子相乘会将其缩放到直方图的高度。
stats.norm.pdf(np.random.randn(N))
的结果将是N个随机样本的概率列表。大多数样本将在曲线中心(y = 0
)附近结束,pdf的高度约为0.40
。这解释了接近该最大值的高峰值。
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
N = 100000
# x = np.random.randn(N)
x = stats.norm.rvs(size=N)
num_bins = 20
plt.hist(x, bins=num_bins, facecolor='blue', alpha=0.5)
y = np.linspace(-4, 4, 1000)
bin_width = (x.max() - x.min()) / num_bins
plt.plot(y, stats.norm.pdf(y) * N * bin_width)
plt.show()
相关文章