如何在多行模式下更改PCRE regexp认为的换行符?

2022-03-29 00:00:00 regex pcre php preg-match

在PHP中使用PCRE正则表达式时,多行模式(/m)使^$能够匹配源文本中的行首和行尾(由换行符分隔),以及源文本的开头和结尾。

这似乎在使用 (LF)作为换行分隔符的Linux上运行得很好,但在使用 (CRLF)的Windows上失败。

有没有办法改变PCRE认为的换行符?或者可能允许它以$匹配行尾/字符串的方式匹配CRLF或LF?

示例:

$EOL = "
";    // Linux LF
$SOURCE_TEXT = "one{$EOL}two{$EOL}three{$EOL}four";
if (preg_match('/^two$/m',$SOURCE_TEXT)) {
    echo 'Found match.';    // <<< RESULT
} else {
    echo 'Did not find match!';
}

结果:成功

$EOL = "
";    // Windows CR+LF
$SOURCE_TEXT = "one{$EOL}two{$EOL}three{$EOL}four";
if (preg_match('/^two$/m',$SOURCE_TEXT)) {
    echo 'Found match.';
} else {
    echo 'Did not find match!';    // <<< RESULT
}

结果:失败


解决方案

您是否尝试了(*CRLF)和相关修饰符?它们在维基百科here(在换行符/换行符选项下)上有详细说明,在我的测试中似乎做了正确的事情。即'/(*CRLF)^two$/m'应与窗口 换行符匹配。而且(*ANYCRLF)应该同时匹配Linux和Windows,但我还没有测试过这一点。

相关文章