Pandas中获取随机抽样(随机数)

2023-02-24 00:00:00 随机 随机数 抽样

在pandas中,可以使用sample()函数对DataFrame或Series进行随机抽样。

下面是一个使用sample()函数的示例:

import pandas as pd

# 创建一个DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
    'age': [20, 25, 30, 35, 40],
    'gender': ['F', 'M', 'M', 'M', 'F'],
    'score': [80, 85, 90, 95, 100]
}
df = pd.DataFrame(data)

# 对df进行随机抽样,抽样数量为2
sampled_df = df.sample(n=2)

# 输出抽样结果
print(sampled_df)

输出结果可能类似于:

   name  age gender  score
4  Emma   40      F    100
2  Charlie   30      M     90

上述示例中,我们首先创建了一个DataFrame df,然后使用sample()函数对它进行了随机抽样,抽样数量为2。最后,我们打印了抽样结果。

除了抽样数量之外,sample()函数还有许多其他参数可以用于控制抽样的方式和样本的属性,例如可以通过设置replace=True参数来允许有放回地抽样,或者可以通过设置weights参数来指定每个样本的权重。更多详细的使用方法可以参考pandas文档。

相关文章