Pandas使用split将字符串拆分成多个子列

2023-02-24 00:00:00 拆分 多个 字符串

Pandas 中,可以使用 str.split() 函数将字符串类型的列拆分成多个子列,并返回一个包含多个子列的 DataFrame。 str.split() 函数可以基于指定的分隔符(默认为空格)将字符串拆分为多个部分。

以下是一个示例,展示如何使用 str.split() 函数将字符串类型的列拆分成多个子列:

import pandas as pd

# 创建一个包含字符串类型列的 DataFrame
df = pd.DataFrame({'Name': ['John Smith', 'Jane Doe', 'Bob Johnson']})

# 使用 str.split() 函数将字符串类型列拆分成多个子列
df[['First Name', 'Last Name']] = df['Name'].str.split(' ', expand=True)

# 打印拆分后的 DataFrame
print(df)

输出:

          Name First Name Last Name
0   John Smith       John     Smith
1     Jane Doe       Jane       Doe
2  Bob Johnson        Bob   Johnson

在这个示例中,我们首先创建了一个包含字符串类型列的 DataFrame,然后使用 str.split() 函数将字符串类型列拆分成多个子列,并使用 expand=True 参数将多个子列扩展为新的列。最后,将多个子列添加到原始 DataFrame 中,并打印拆分后的 DataFrame。

需要注意的是,使用 str.split() 函数会返回一个新的 DataFrame,因此需要使用 .split() 方法拆分列并将其分配给一个新的列或 DataFrame。

除了 str.split() 函数之外,还有其他函数和方法可以用于拆分 Pandas DataFrame,例如 str.extract() 函数和 str.replace() 函数等。这些函数和方法可以根据不同的需求,对字符串类型的列进行拆分和处理。

相关文章