如何使用python matplotlib绘制正态分布的直方图?

问题描述

我的问题是-使用NumPy函数np.随机性.randn为100,000个点的正态分布生成数据x。然后绘制直方图。

我的计算是-

x = sp.norm.pdf(np.random.randn(100000))
plt.hist(x, bins = 20, facecolor='blue', alpha=0.5)

是否有问题,因为我无法获得正态分布的直方图?


解决方案

要从标准正态分布中获得N个随机样本,您可以使用np.random.randn(N)或Scipy的stats.norm.rvs(size=N)。然后可以使用这些样本创建直方图。

要绘制曲线,可以使用stats.norm.pdf(y),其中y是后续x值的数组。这样的pdf是标准化的,即绘图下的面积是1。直方图的总面积是样本数乘以箱的宽度(每个样本正好落在一个箱中)。因此,将pdf与该因子相乘会将其缩放到直方图的高度。

stats.norm.pdf(np.random.randn(N))的结果将是N个随机样本的概率列表。大多数样本将在曲线中心(y = 0)附近结束,pdf的高度约为0.40。这解释了接近该最大值的高峰值。

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

N = 100000
# x = np.random.randn(N)
x = stats.norm.rvs(size=N)
num_bins = 20
plt.hist(x, bins=num_bins, facecolor='blue', alpha=0.5)

y = np.linspace(-4, 4, 1000)
bin_width = (x.max() - x.min()) / num_bins
plt.plot(y, stats.norm.pdf(y) * N * bin_width)

plt.show()

相关文章