Python 正则表达式：split

2023-01-31 01:01:11 python split 正则表达式

作用：用正则表达式的字符分割字符串，正则的字符会被抛弃。

本文以提取URL的地址与参数为例，介绍re模块的split的用法: 返回值 -> 列表

复杂匹配 = re.compile(正则表达式): 将正则表达式实例化

re.split（要匹配的字符串）: 从字符串开头开始匹配，寻找完整个字符串后，将结果以列表返回

简单匹配 = re.split(正则表达式，要匹配的原字符串）: 从字符串开头开始匹配，寻找完整个字符串后，将结果以列表返回

懒癌，配上模块函数解释好消化

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功，则返回一个列表，否则返回原string列表；
第一个参数：正则表达式
第二个参数：要匹配查找的原始字符串；
第三个参数：可选参数，表示最大的拆分次数，默认为0，表示全部分割；
第四个参数：可选参数，标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等；
需要特别注意的是，这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符，仍然视为成功。想要完全匹配，可以在表达式末尾加上边界匹配符'$'
例如： re.split(‘z’, ‘p.python.p’)返回值为['p.Python.p']；  #失败返回原string列表
       re.split(‘p’, ‘p.python.p’)返回值为['', '.', 'ython.', '']   #成功返回新列表

方法一：

对象名1 = re.split(正则表达式, 要匹配的原字符串)

#!/usr/bin/python
# -*- coding: utf-8 -*-

import os,re;

pattern = r'[?|&]'
string = "https://www.baidu.com/baidu?&ie=utf-8&Word=51cto"
result = re.split(pattern, string)
print('Match:',result)

运行结果：

Match: ['Https://www.baidu.com/baidu', '', 'ie=utf-8', 'word=51cto']

相关文章