Pandas几种常用的循环遍历方法

2023-02-24 00:00:00 遍历 循环 几种

在 pandas 中,可以使用 for 循环遍历数据帧中的行或列。以下是一些常见的循环遍历方法:

1、使用 iterrows() 方法循环遍历行
iterrows() 方法返回一个迭代器,可以遍历数据帧中的每一行。以下是一个示例:

import pandas as pd

# 创建数据帧
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 使用 iterrows() 方法遍历行
for index, row in df.iterrows():
    print(index, row['A'], row['B'])

在上面的示例中,我们首先创建了一个简单的数据帧。然后,我们使用 iterrows() 方法遍历每一行,并输出行的索引和值。

2、使用 iteritems() 方法循环遍历列
iteritems() 方法返回一个迭代器,可以遍历数据帧中的每一列。以下是一个示例:

import pandas as pd

# 创建数据帧
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 使用 iteritems() 方法遍历列
for column, values in df.iteritems():
    print(column, values.tolist())

在上面的示例中,我们首先创建了一个简单的数据帧。然后,我们使用 iteritems() 方法遍历每一列,并输出列名和值。

3、使用 apply() 方法循环遍历行或列
apply() 方法接受一个函数作为参数,并将其应用于数据帧的每一行或每一列。以下是一个示例:

import pandas as pd

# 创建数据帧
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 使用 apply() 方法遍历每一行,并计算每行的和
sums = df.apply(lambda x: x.sum(), axis=1)
print(sums)

# 使用 apply() 方法遍历每一列,并计算每列的平均值
means = df.apply(lambda x: x.mean(), axis=0)
print(means)

在上面的示例中,我们首先创建了一个简单的数据帧。然后,我们使用 apply() 方法遍历每一行,并计算每行的和,或者遍历每一列,并计算每列的平均值。注意,apply() 方法的 axis 参数用于指定应该应用函数的轴,axis=1 表示应用于每一行,axis=0 表示应用于每一列。

除了上述方法之外,pandas 还提供了许多其他方法,例如 applymap()、map() 和 transform() 等,可以根据需要使用。你可以查看 pandas 官方文档以获取更多关于循环遍历的方法和用法。

相关文章