Pandas使用split将字符串拆分成多个子列
Pandas 中,可以使用 str.split() 函数将字符串类型的列拆分成多个子列,并返回一个包含多个子列的 DataFrame。 str.split() 函数可以基于指定的分隔符(默认为空格)将字符串拆分为多个部分。
以下是一个示例,展示如何使用 str.split() 函数将字符串类型的列拆分成多个子列:
import pandas as pd # 创建一个包含字符串类型列的 DataFrame df = pd.DataFrame({'Name': ['John Smith', 'Jane Doe', 'Bob Johnson']}) # 使用 str.split() 函数将字符串类型列拆分成多个子列 df[['First Name', 'Last Name']] = df['Name'].str.split(' ', expand=True) # 打印拆分后的 DataFrame print(df)
输出:
Name First Name Last Name 0 John Smith John Smith 1 Jane Doe Jane Doe 2 Bob Johnson Bob Johnson
在这个示例中,我们首先创建了一个包含字符串类型列的 DataFrame,然后使用 str.split() 函数将字符串类型列拆分成多个子列,并使用 expand=True 参数将多个子列扩展为新的列。最后,将多个子列添加到原始 DataFrame 中,并打印拆分后的 DataFrame。
需要注意的是,使用 str.split() 函数会返回一个新的 DataFrame,因此需要使用 .split() 方法拆分列并将其分配给一个新的列或 DataFrame。
除了 str.split() 函数之外,还有其他函数和方法可以用于拆分 Pandas DataFrame,例如 str.extract() 函数和 str.replace() 函数等。这些函数和方法可以根据不同的需求,对字符串类型的列进行拆分和处理。
相关文章