pandas 字符串截取
pandas 是一个流行的 Python 数据处理库,提供了许多用于操作结构化数据的函数。其中之一是字符串截取函数。
以下是使用 pandas 字符串截取函数的示例代码:
import pandas as pd # 创建一个包含字符串数据的数据帧 data = pd.DataFrame({ 'A': ['foo123', 'bar456', 'baz789', 'qux123', 'quux456'], 'B': ['apple', 'banana', 'cherry', 'date', 'elderberry'] }) # 截取第一列的前三个字符 col_A_trimmed = data['A'].str[:3] # 截取第一列的第 4 个字符到末尾 col_A_substring = data['A'].str[3:] # 使用正则表达式提取第一列中的数字 col_A_digits = data['A'].str.extract('(\d+)') # 显示处理后的数据帧 print(col_A_trimmed) print(col_A_substring) print(col_A_digits)
在此示例中,我们首先创建了一个包含字符串数据的数据帧 data。然后,我们使用 str 属性和切片操作截取第一列的前三个字符,并将结果存储在 col_A_trimmed 中。接下来,我们使用 str 属性和切片操作截取第一列的第 4 个字符到末尾,并将结果存储在 col_A_substring 中。最后,我们使用 str.extract 函数和正则表达式 (\d+) 提取第一列中的数字,并将结果存储在 col_A_digits 中。最后,我们使用 print 函数显示处理后的数据帧。
pandas 还提供了其他函数,如 str.split 和 str.replace,可以进行更加灵活和高级的字符串操作。这些函数支持使用正则表达式进行字符串分割和替换,并支持多个分隔符的组合。可以根据具体的数据分析需求选择最适合的字符串操作函数。
相关文章