Pandas中获取随机抽样(随机数)
在pandas中,可以使用sample()函数对DataFrame或Series进行随机抽样。
下面是一个使用sample()函数的示例:
import pandas as pd # 创建一个DataFrame data = { 'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'], 'age': [20, 25, 30, 35, 40], 'gender': ['F', 'M', 'M', 'M', 'F'], 'score': [80, 85, 90, 95, 100] } df = pd.DataFrame(data) # 对df进行随机抽样,抽样数量为2 sampled_df = df.sample(n=2) # 输出抽样结果 print(sampled_df)
输出结果可能类似于:
name age gender score 4 Emma 40 F 100 2 Charlie 30 M 90
上述示例中,我们首先创建了一个DataFrame df,然后使用sample()函数对它进行了随机抽样,抽样数量为2。最后,我们打印了抽样结果。
除了抽样数量之外,sample()函数还有许多其他参数可以用于控制抽样的方式和样本的属性,例如可以通过设置replace=True参数来允许有放回地抽样,或者可以通过设置weights参数来指定每个样本的权重。更多详细的使用方法可以参考pandas文档。
相关文章