Pandas几种常用的循环遍历方法
在 pandas 中,可以使用 for 循环遍历数据帧中的行或列。以下是一些常见的循环遍历方法:
1、使用 iterrows() 方法循环遍历行
iterrows() 方法返回一个迭代器,可以遍历数据帧中的每一行。以下是一个示例:
import pandas as pd # 创建数据帧 df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) # 使用 iterrows() 方法遍历行 for index, row in df.iterrows(): print(index, row['A'], row['B'])
在上面的示例中,我们首先创建了一个简单的数据帧。然后,我们使用 iterrows() 方法遍历每一行,并输出行的索引和值。
2、使用 iteritems() 方法循环遍历列
iteritems() 方法返回一个迭代器,可以遍历数据帧中的每一列。以下是一个示例:
import pandas as pd # 创建数据帧 df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) # 使用 iteritems() 方法遍历列 for column, values in df.iteritems(): print(column, values.tolist())
在上面的示例中,我们首先创建了一个简单的数据帧。然后,我们使用 iteritems() 方法遍历每一列,并输出列名和值。
3、使用 apply() 方法循环遍历行或列
apply() 方法接受一个函数作为参数,并将其应用于数据帧的每一行或每一列。以下是一个示例:
import pandas as pd # 创建数据帧 df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) # 使用 apply() 方法遍历每一行,并计算每行的和 sums = df.apply(lambda x: x.sum(), axis=1) print(sums) # 使用 apply() 方法遍历每一列,并计算每列的平均值 means = df.apply(lambda x: x.mean(), axis=0) print(means)
在上面的示例中,我们首先创建了一个简单的数据帧。然后,我们使用 apply() 方法遍历每一行,并计算每行的和,或者遍历每一列,并计算每列的平均值。注意,apply() 方法的 axis 参数用于指定应该应用函数的轴,axis=1 表示应用于每一行,axis=0 表示应用于每一列。
除了上述方法之外,pandas 还提供了许多其他方法,例如 applymap()、map() 和 transform() 等,可以根据需要使用。你可以查看 pandas 官方文档以获取更多关于循环遍历的方法和用法。
相关文章