PHP预置替换剥离(_REPLACE)

2022-03-23 00:00:00 regex php preg-replace

我要使用preg_place()删除所有注释及其内容。

示例:

$mDom =  
<<<HTML
<html>
word1 <!-- word2 --> word3 <!-- word4 --> word5
</html>
HTML;

$mDom = preg_replace('/<!--.*-->/ius', '', $mDom);

var_dump( $mDom );
上面的示例将打印:"word1 word5"
我想要:"word1 word3 word5"


解决方案

您需要使用懒惰(非贪婪)量化:

/<!--.*?-->/ius
请注意*后面的?。它会导致正则表达式引擎在找到匹配项后立即停止,而不会尝试尽可能长的时间进行匹配。

Read more about it。


编辑:您还可以使用特殊修饰符U

U(PCRE_UNGREADY)
此修饰符反转量词的"贪婪",以便它们在默认情况下不是贪婪的,但如果后跟?则变为贪婪。

(PHP手册:Possible modifiers in regex patterns)

相关文章