Pandas使用 merge() 方法进行数据合并操作

2023-02-23 00:00:00 操作 合并 方法

在 Pandas 中,可以使用 merge() 方法进行数据合并操作,也被称为 join 操作。merge() 方法有许多参数,这里只介绍一些常用的。

假设有两个 DataFrame 对象 df1 和 df2,其中 df1 包含一些学生的信息,df2 包含每个学生的成绩信息。

首先,我们需要创建这两个 DataFrame 对象:

import pandas as pd

data1 = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [20, 21, 19, 20], 'Gender': ['F', 'M', 'M', 'M']}
df1 = pd.DataFrame(data1)

data2 = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Score': [90, 80, 95, 85]}
df2 = pd.DataFrame(data2)

现在我们可以使用 merge() 方法将这两个 DataFrame 对象合并成一个:

result = pd.merge(df1, df2, on='Name')

on 参数用于指定连接两个 DataFrame 对象的键,这里我们选择 Name 作为键。结果 DataFrame 对象 result 包含了学生的所有信息以及他们的成绩:

       Name  Age Gender  Score
0     Alice   20      F     90
1       Bob   21      M     80
2   Charlie   19      M     95
3     David   20      M     85

还有一些其他的参数,例如 how 参数用于指定合并方式(包括 inner, outer, left 和 right),left_on 和 right_on 参数用于指定左右 DataFrame 对象中连接的键,等等。可以根据具体需求进行使用。

相关文章