pandas 字符串截取

2023-02-24 00:00:00 pandas 字符串 截取

pandas 是一个流行的 Python 数据处理库,提供了许多用于操作结构化数据的函数。其中之一是字符串截取函数。

以下是使用 pandas 字符串截取函数的示例代码:

import pandas as pd

# 创建一个包含字符串数据的数据帧
data = pd.DataFrame({
    'A': ['foo123', 'bar456', 'baz789', 'qux123', 'quux456'],
    'B': ['apple', 'banana', 'cherry', 'date', 'elderberry']
})

# 截取第一列的前三个字符
col_A_trimmed = data['A'].str[:3]

# 截取第一列的第 4 个字符到末尾
col_A_substring = data['A'].str[3:]

# 使用正则表达式提取第一列中的数字
col_A_digits = data['A'].str.extract('(\d+)')

# 显示处理后的数据帧
print(col_A_trimmed)
print(col_A_substring)
print(col_A_digits)

在此示例中,我们首先创建了一个包含字符串数据的数据帧 data。然后,我们使用 str 属性和切片操作截取第一列的前三个字符,并将结果存储在 col_A_trimmed 中。接下来,我们使用 str 属性和切片操作截取第一列的第 4 个字符到末尾,并将结果存储在 col_A_substring 中。最后,我们使用 str.extract 函数和正则表达式 (\d+) 提取第一列中的数字,并将结果存储在 col_A_digits 中。最后,我们使用 print 函数显示处理后的数据帧。

pandas 还提供了其他函数,如 str.split 和 str.replace,可以进行更加灵活和高级的字符串操作。这些函数支持使用正则表达式进行字符串分割和替换,并支持多个分隔符的组合。可以根据具体的数据分析需求选择最适合的字符串操作函数。

相关文章