Pandas使用 merge() 方法进行数据合并操作
在 Pandas 中,可以使用 merge() 方法进行数据合并操作,也被称为 join 操作。merge() 方法有许多参数,这里只介绍一些常用的。
假设有两个 DataFrame 对象 df1 和 df2,其中 df1 包含一些学生的信息,df2 包含每个学生的成绩信息。
首先,我们需要创建这两个 DataFrame 对象:
import pandas as pd data1 = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [20, 21, 19, 20], 'Gender': ['F', 'M', 'M', 'M']} df1 = pd.DataFrame(data1) data2 = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Score': [90, 80, 95, 85]} df2 = pd.DataFrame(data2)
现在我们可以使用 merge() 方法将这两个 DataFrame 对象合并成一个:
result = pd.merge(df1, df2, on='Name')
on 参数用于指定连接两个 DataFrame 对象的键,这里我们选择 Name 作为键。结果 DataFrame 对象 result 包含了学生的所有信息以及他们的成绩:
Name Age Gender Score 0 Alice 20 F 90 1 Bob 21 M 80 2 Charlie 19 M 95 3 David 20 M 85
还有一些其他的参数,例如 how 参数用于指定合并方式(包括 inner, outer, left 和 right),left_on 和 right_on 参数用于指定左右 DataFrame 对象中连接的键,等等。可以根据具体需求进行使用。
相关文章