在PHP中使用正则表达式将括号嵌套到数组

2022-07-03 00:00:00 regex php preg-match preg-match-all

可能的重复项:
Regular Expression to match outer brackets

我有一个以下格式的字符串:

(aaa(Bbb)ccc)(ddd(Eee)fff)ggg)(hhh(Iii))(jjj(Kkk)lll)mmm)(nnnn(Ooo)ppp)(qqq(Rrr)sss)

主要分为三个部分:

(AAA(BBB)CCC)(DDD(Eee)Fff)GGG)(HHH(III))(JJJ(KKK)lll)mmm)

(nnn(Ooo)ppp)

(QQQ(RRR)sss)

我需要搜索表达式来获取数组中的3个部分(忽略任何子括号)。 完成后,我需要另一个搜索表达式来拆分各个部分(仅第2和第3部分):

(nnn(Ooo)ppp)=>nnn,ooo,ppp

谢谢


解决方案

我认为我会这样做:

<?php

$string = '(((aaa (bbb) ccc)(ddd (eee) fff) ggg)(hhh (iii) )(jjj (kkk) lll) mmm)(nnn (ooo) ppp)(qqq (rrr) sss)';

function parse_string($input) {
    $len = strlen($input);
    $substrings = array();
    $paren_count = 0;
    $cur_string = '';
    for ($i = 0; $i < $len; $i++) {
        $char = $input[$i];
        if ($char == '(') {
            $paren_count += 1;
        } elseif ($char == ')') {
            $paren_count -= 1;
        }
        $cur_string .= $char;
        if ($paren_count == 0 && strlen($cur_string)) {
            $substrings[] = $cur_string;
            $cur_string = '';
        }
    }
    return $substrings;
}

function convert_str($input) {
    $search = array('(', ')', ' ');
    $replace = array('', '', ',');
    return str_replace($search, $replace, $input);
}


$parsed_string = parse_string($string);
echo convert_str($parsed_string[1]);

输出:

nnn,ooo,ppp

这是一种状态机。

相关文章