python正则表达式找单词
以下是一个可以匹配文本中所有单词的正则表达式,在 Python 中使用可以调用 re 模块的 findall 函数:
import re text = "This is a sample text with several words." pattern = r"\b\w+\b" words = re.findall(pattern, text) print(words)
上面的代码中,\b 表示单词边界,确保匹配到的单词前后没有其他字符。\w+ 表示匹配一个或多个字母、数字或下划线,这样就可以匹配到一个单词了。
上述代码将会输出以下内容:
['This', 'is', 'a', 'sample', 'text', 'with', 'several', 'words']
其中,['This', 'is', 'a', 'sample', 'text', 'with', 'several', 'words'] 是匹配到的所有单词。如果你需要区分单词的大小写,可以将正则表达式改成 r"\b[a-zA-Z]+\b"。如果你需要匹配到中文单词,可以将正则表达式改成 r"\b[\u4e00-\u9fa5]+\b"。
相关文章