如何在多行模式下更改PCRE regexp认为的换行符?
在PHP中使用PCRE正则表达式时,多行模式(/m
)使^
和$
能够匹配源文本中的行首和行尾(由换行符分隔),以及源文本的开头和结尾。
这似乎在使用
(LF)作为换行分隔符的Linux上运行得很好,但在使用
(CRLF)的Windows上失败。
有没有办法改变PCRE认为的换行符?或者可能允许它以$
匹配行尾/字符串的方式匹配CRLF或LF?
示例:
$EOL = "
"; // Linux LF
$SOURCE_TEXT = "one{$EOL}two{$EOL}three{$EOL}four";
if (preg_match('/^two$/m',$SOURCE_TEXT)) {
echo 'Found match.'; // <<< RESULT
} else {
echo 'Did not find match!';
}
结果:成功
$EOL = "
"; // Windows CR+LF
$SOURCE_TEXT = "one{$EOL}two{$EOL}three{$EOL}four";
if (preg_match('/^two$/m',$SOURCE_TEXT)) {
echo 'Found match.';
} else {
echo 'Did not find match!'; // <<< RESULT
}
结果:失败
解决方案
您是否尝试了(*CRLF)
和相关修饰符?它们在维基百科here(在换行符/换行符选项下)上有详细说明,在我的测试中似乎做了正确的事情。即'/(*CRLF)^two$/m'
应与窗口
换行符匹配。而且(*ANYCRLF)
应该同时匹配Linux和Windows,但我还没有测试过这一点。
相关文章