匹配不限数量的选项的正则表达式

2022-03-29 00:00:00 regex php preg-match

我希望能够分析如下文件路径:

 /var/www/index.(htm|html|php|shtml)

转换为有序数组:

 array("htm", "html", "php", "shtml")

然后生成备选方案列表:

/var/www/index.htm
/var/www/index.html
/var/www/index.php
/var/www/index.shtml

现在,我有一个preg_match语句可以拆分两个备选方案:

 preg_match_all ("/(([^)]*)|([^)]*))/", $path_resource, $matches);

有人能告诉我如何扩展它以接受无限数量的替代方案(至少两个)吗?只是关于正则表达式,其余的我可以处理。

规则是:

  • 列表需要以(开头,以)

  • 结尾
  • 列表中必须有一个|(即至少有两个备选方案)

  • ()的任何其他事件将保持不变。

更新:我还需要能够处理多个括号对,例如:

 /var/(www|www2)/index.(htm|html|php|shtml)

抱歉,我没有直接说出来。

更新2:如果您希望在文件系统中执行我正在尝试执行的操作,请注意,GLOB()已经提供了该功能。不需要实施定制解决方案。有关详细信息,请参阅下面@Gordon的答案。


解决方案

非正则表达式解决方案:)

<?php

$test = '/var/www/index.(htm|html|php|shtml)';

/**
 *
 * @param string $str "/var/www/index.(htm|html|php|shtml)"
 * @return array "/var/www/index.htm", "/var/www/index.php", etc
 */
function expand_bracket_pair($str)
{
    // Only get the very last "(" and ignore all others.
    $bracketStartPos = strrpos($str, '(');
    $bracketEndPos = strrpos($str, ')');

    // Split on ",".
    $exts = substr($str, $bracketStartPos, $bracketEndPos - $bracketStartPos);
    $exts = trim($exts, '()|');
    $exts = explode('|', $exts);

    // List all possible file names.
    $names = array();

    $prefix = substr($str, 0, $bracketStartPos);
    $affix = substr($str, $bracketEndPos + 1);
    foreach ($exts as $ext)
    {
        $names[] = "{$prefix}{$ext}{$affix}";
    }

    return $names;
}

function expand_filenames($input)
{
    $nbBrackets = substr_count($input, '(');

    // Start with the last pair.
    $sets = expand_bracket_pair($input);

    // Now work backwards and recurse for each generated filename set.
    for ($i = 0; $i < $nbBrackets; $i++)
    {
        foreach ($sets as $k => $set)
        {
            $sets = array_merge(
                $sets,
                expand_bracket_pair($set)
            );
        }
    }

    // Clean up.
    foreach ($sets as $k => $set)
    {
        if (false !== strpos($set, '('))
        {
            unset($sets[$k]);
        }
    }
    $sets = array_unique($sets);
    sort($sets);

    return $sets;
}

var_dump(expand_filenames('/(a|b)/var/(www|www2)/index.(htm|html|php|shtml)'));

相关文章