Pandas使用join函数对多个DataFrame进行合并

2023-02-24 00:00:00 函数 多个 合并

在 Pandas 中,可以使用 join() 函数将两个或多个 DataFrame 按照指定的列或索引进行合并。join() 函数提供了多种不同的合并方式,例如内连接、左连接、右连接和外连接等。

以下是一个简单的示例,展示如何使用 join() 函数进行内连接:

import pandas as pd

# 创建两个 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
                    'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
                    'value': [5, 6, 7, 8]})

# 使用 join() 函数进行内连接
result = pd.merge(df1, df2, on='key', how='inner')
print(result)

输出:

  key  value_x  value_y
0   B        2        5
1   D        4        6

在这个示例中,我们首先创建了两个 DataFrame,然后使用 join() 函数进行内连接。具体来说,我们通过在 on 参数中指定连接列(即 key 列),以及在 how 参数中指定连接方式(即内连接),将两个 DataFrame 按照 key 列进行合并。

此外,还可以通过 left_on 和 right_on 参数分别指定左 DataFrame 和右 DataFrame 中的连接列,或者通过 left_index 和 right_index 参数分别指定左 DataFrame 和右 DataFrame 中的索引列进行合并。

除了内连接之外,还可以使用 how 参数指定左连接(left)、右连接(right)或外连接(outer)等不同的合并方式。

总之,在 Pandas 中,可以使用 join() 函数灵活地合并不同的 DataFrame,并根据不同的需求进行合并。

相关文章