从regexp获得的反向引用多于圆括号
好的,这真的很难用英语解释,所以我就举个例子。
我将拥有以下格式的字符串:
key-value;key1-value;key2-...
我需要将数据提取为数组
array('key'=>'value','key1'=>'value1', ... )
我计划使用regexp来实现(大部分)此功能,并编写了以下正则表达式:
/^(w+)-([^-;]+)(?:;(w+)-([^-;]+))*;?$/
使用preg_match
和此代码:
for ($l = count($matches),$i = 1;$i<$l;$i+=2) {
$parameters[$matches[$i]] = $matches[$i+1];
}
但是,regexp显然只返回4个反向引用,即输入字符串的第一个和最后一个键值对。有什么办法可以绕过这件事吗?我知道我可以使用正则表达式来测试字符串的正确性,并在循环中使用PHP的explode
并获得完美的结果,但我真的很好奇正则表达式是否可以这样做。
简而言之,我需要通过正则表达式在字符串中捕获任意数量的key-value;
对。
解决方案
您可以在提取匹配项时使用先行查找来验证输入:
/G(?=(?:w++-[^;-]++;?)++$)(w++)-([^;-]++);?/
(?=(?:w++-[^;-]++;?)++$)
是验证部分。如果输入无效,匹配将立即失败,但每次应用正则表达式时仍会计算先行。为了使它(以及正则表达式的其余部分)与键-值对保持同步,我使用G
将每个匹配锚定到前一个匹配结束的位置。
这样,如果第一次先行成功,则保证以后每次都会成功。显然,它的效率并不像它可能达到的那样高,但这可能不是问题--只有您的测试才能确定。
如果先行查找失败,preg_match_all()
将返回0(FALSE)。如果成功,将在数组数组中返回匹配项:一个数组用于完整的键-值对,一个用于键,一个用于值。
相关文章