Python正则表达式中的'r'用法总结

2023-05-18 09:05:23 python 正则表达式 用法

Python正则表达式中的'r'

最近遇到一个非常困惑的地方,那就是在使用Python中的正则表达式的时候,正则表达式前面的’r’带来的影响。自己最开始的困惑点在于,’r‘的作用是声明为原始字符串,那么按照此种逻辑,‘\n’匹配的就是换行符,而r’\n’匹配的不就是原始的’\‘和’n’两个字符嘛。但是可以发现r’\n’也可以匹配换行符,这就让笔者感到非常疑惑。经过分析参考,自己得出了一套解释,不一定正确,大家可以作为一定的参考。

import re
data = "Give a thumb up!\nThank you!"
print(data)
print(re.findall('\n', data))
print(re.findall(r'\n', data))

发现输出如下所示,可以发现r’\n’依然能够匹配换行符

一、Python字符串前面加'r'

对于Python字符串,前面加’r’的解释较为简单,就是决定一个字符串是否为原生字符串,具体示例如下所示

data1 = "Give a thumb up!\nThank you!"
print(data1)
data2 = r"Give a thumb up!\nThank you!"
print(data2)

输入如下所示

二、正则表达式匹配原理

下面给出自己对于正则匹配过程的理解,这部分完全为个人理解,本质上是为了解释文章开始提出的那个奇怪的问题。当我们在程序中定义了一个正则表达式,首先会对给出的字面的正则表达式做一个转换,例如如果定义一个正则表达式为’\\\\‘,那么这个字面的’\\\\‘会进行转义,那么正则表达式里面的值就是’\\‘。此时,正则表达式的值为’\\‘,那么进行匹配时,’\\‘匹配的就是’\‘,第一个’\‘代表转义,所以此时进行匹配,就能够匹配原始字符串中的’\'。程序运行如下

data = "Give\Thank you!"
print(data)
tmp_str = []
tmp_str.append(data[4])
print(tmp_str)
print(re.findall('\\\\', data))

程序输入如下所示

为了更好解释匹配原理,画一张图来解释

三、正则表达式前面加'r'

由上述的原理图,那么在正则表达式前面加’r’相当于是原生字符串,会导致正则表达式接受的值就是被赋值的字面值,也就相当于Python解释器不会进行转换了,赋值r’\\‘,那么正则表达式接受的值就是’\\',示例如下所示

data = "Give a thumb up\Thank you!"
print(data)
print(re.findall(r'\\', data))

运行结果如下

那接下来看一个例子,来理解’\n’有关的问题

data = "Give a thumb up\nThank you!\nMua"
print(data)
print(re.findall('\n', data))
print(re.findall(r'\n', data))
print(re.findall('\\n', data))
print(re.findall(r'\\n', data))

输出如下

第一种情况,字面为’\n’,那么正则表达式实际接受的值为换行符,换行符直接就可以匹配字符串中的换行符

第二种情况,正则表达式实际接受的值为’\n’,‘\n’在匹配的时候代表换行符,能够匹配出字符串中的换行符

第三种情况,字面值为’\\n’,Pyhton解释器经过解释,对’\\‘进行转义,正则表达式实际接收的值为’\n’,在匹配时能够匹配换行符

第四种情况,为原生字符串,正则表达式实际接收的值为’\\n’,‘\\n’在进行匹配时对’\\‘进行转义,所以匹配的是’\'和’n’两个字符,验证此种情况如下

data = r"Give a thumb up\nThank you!\nMua"
print(data)
print(re.findall('\n', data))
print(re.findall(r'\n', data))
print(re.findall('\\n', data))
print(re.findall(r'\\n', data))

总结

到此这篇关于Python正则表达式中的'r'用法总结的文章就介绍到这了,更多相关Python正则表达式'r'内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

相关文章