Pandas中split()方法如何使用
Pandas中的split()方法可以用来将一个数据框中的一列分割为多列,以便进行更深入的分析。
使用split()方法的语法如下:
DataFrame.split(pat = None, n = None, expand = False)
其中,pat参数是一个正则表达式,用于指定要拆分的字符串;n参数是要拆分的次数;expand参数控制分割后的数据是否作为新的列添加到数据框中。
要使用split()方法,首先需要导入Pandas模块:
import pandas as pd
然后,创建一个数据框:
df = pd.DataFrame({'name':['John','Bob','Alice','Mary'],
'age':[20,30,25,35]})
然后,使用split()方法来分割数据框中的一列:
df_split = df['name'].str.split(' ',expand=True)
这将返回一个新的数据框,其中包含原始数据框中的列,以及按照空格分割后的多列:
df_split
name 0 1
0 John NaN
1 Bob NaN
2 Alice NaN
3 Mary NaN
此外,还可以使用split()方法将一列按照指定的字符串进行分割,比如:
df_split2 = df['name'].str.split('-',expand=True)
这将返回一个新的数据框,其中包含原始数据框中的列,以及按照横杠分割后的多列:
df_split2
name 0 1
0 John NaN
1 Bob NaN
2 Alice NaN
3 Mary NaN
总之,Pandas中的split()方法可以用来将一个数据框中的一列分割为多列,以便进行更深入的分析,而且可以指定要拆分的字符串,以及控制分割后的数据是否作为新的列添加到数据框中。
相关文章