python正则表达式找单词

2023-02-28 00:00:00 python 单词 正则表达式

以下是一个可以匹配文本中所有单词的正则表达式,在 Python 中使用可以调用 re 模块的 findall 函数:

import re

text = "This is a sample text with several words."
pattern = r"\b\w+\b"
words = re.findall(pattern, text)
print(words)

上面的代码中,\b 表示单词边界,确保匹配到的单词前后没有其他字符。\w+ 表示匹配一个或多个字母、数字或下划线,这样就可以匹配到一个单词了。

上述代码将会输出以下内容:

['This', 'is', 'a', 'sample', 'text', 'with', 'several', 'words']

其中,['This', 'is', 'a', 'sample', 'text', 'with', 'several', 'words'] 是匹配到的所有单词。如果你需要区分单词的大小写,可以将正则表达式改成 r"\b[a-zA-Z]+\b"。如果你需要匹配到中文单词,可以将正则表达式改成 r"\b[\u4e00-\u9fa5]+\b"。

相关文章