从regexp获得的反向引用多于圆括号

2022-03-29 00:00:00 regex php preg-match

好的,这真的很难用英语解释,所以我就举个例子。

我将拥有以下格式的字符串:

key-value;key1-value;key2-...

我需要将数据提取为数组

array('key'=>'value','key1'=>'value1', ... )

我计划使用regexp来实现(大部分)此功能,并编写了以下正则表达式:

/^(w+)-([^-;]+)(?:;(w+)-([^-;]+))*;?$/

使用preg_match和此代码:

for ($l = count($matches),$i = 1;$i<$l;$i+=2) {
    $parameters[$matches[$i]] = $matches[$i+1];
}
但是,regexp显然只返回4个反向引用,即输入字符串的第一个和最后一个键值对。有什么办法可以绕过这件事吗?我知道我可以使用正则表达式来测试字符串的正确性,并在循环中使用PHP的explode并获得完美的结果,但我真的很好奇正则表达式是否可以这样做。

简而言之,我需要通过正则表达式在字符串中捕获任意数量的key-value;对。


解决方案

您可以在提取匹配项时使用先行查找来验证输入:

/G(?=(?:w++-[^;-]++;?)++$)(w++)-([^;-]++);?/

(?=(?:w++-[^;-]++;?)++$)是验证部分。如果输入无效,匹配将立即失败,但每次应用正则表达式时仍会计算先行。为了使它(以及正则表达式的其余部分)与键-值对保持同步,我使用G将每个匹配锚定到前一个匹配结束的位置。

这样,如果第一次先行成功,则保证以后每次都会成功。显然,它的效率并不像它可能达到的那样高,但这可能不是问题--只有您的测试才能确定。

如果先行查找失败,preg_match_all()将返回0(FALSE)。如果成功,将在数组数组中返回匹配项:一个数组用于完整的键-值对,一个用于键,一个用于值。

相关文章