正则表达式:删除空格,但不从<>标记中删除

2022-03-23 00:00:00 string regex php preg-replace

我一直在为regexp而苦苦挣扎很久了..我需要的是从字符串中删除所有空格,而不是从<;标记中删除(例如。a HREF标记或img src标记必须包含空格)。

我正在用PHP做这件事,并且我在尝试不同的解决方案(我对regexp完全是个新手,这让我很困惑)。 到目前为止,这是我的代码部分:

$text=$_POST["text"];
$pattern = '(<.+?>)|s'; 
$replace = '';
echo preg_replace( $pattern, $replace, $text );

这有什么问题?::(


解决方案

首先,您忘记了正则表达式周围的分隔符。然后,正则表达式/(<.+?>)|s/匹配一个标记或空格,因此您的preg_replace()用空字符串替换其中一个。

至少可以说,使用正则表达式操作HTML是困难的。如果您可以确保文件中除分隔标记的位置外不会有任何<>,则可以查找最接近的括号(如果有)是开始括号的空格:

$result = preg_replace(
    '/s+     # Match one or more whitespace characters
    (?!       # but only if it is impossible to match...
     [^<>]*   # any characters except angle brackets
     >        # followed by a closing bracket.
    )         # End of lookahead
    /x', 
    '', $subject);

相关文章