正则表达式:删除空格,但不从<;>;标记中删除
我一直在为regexp而苦苦挣扎很久了..我需要的是从字符串中删除所有空格,而不是从<;标记中删除(例如。a HREF标记或img src标记必须包含空格)。
我正在用PHP做这件事,并且我在尝试不同的解决方案(我对regexp完全是个新手,这让我很困惑)。 到目前为止,这是我的代码部分:
$text=$_POST["text"];
$pattern = '(<.+?>)|s';
$replace = '';
echo preg_replace( $pattern, $replace, $text );
这有什么问题?::(
解决方案
首先,您忘记了正则表达式周围的分隔符。然后,正则表达式/(<.+?>)|s/
匹配一个标记或空格,因此您的preg_replace()
用空字符串替换其中一个。
至少可以说,使用正则表达式操作HTML是困难的。如果您可以确保文件中除分隔标记的位置外不会有任何<
和>
,则可以查找最接近的括号(如果有)是开始括号的空格:
$result = preg_replace(
'/s+ # Match one or more whitespace characters
(?! # but only if it is impossible to match...
[^<>]* # any characters except angle brackets
> # followed by a closing bracket.
) # End of lookahead
/x',
'', $subject);
相关文章