两个标记之间的JavaScript正则表达式多行文本
我编写了一个正则表达式以从HTML获取字符串,但似乎多行标志不起作用。
这是我的模式,我想获取h1
标记中的文本。
var pattern= /<div class="box-content-5">.*<h1>([^<]+?)</h1>/mi
m = html.search(pattern);
return m[1];
我创建了一个字符串来测试它。当字符串包含"
,则结果始终为空。如果删除所有
"s,它给了我正确的结果,无论有没有/m
标志。
我的正则表达式有什么问题?
解决方案
您正在寻找/.../s
修饰符,也称为doTall修饰符。它强制点.
也匹配换行符,而它默认情况下不会这样做。
坏消息是它<%s>不存在于(从ES2018开始,见下文)。好消息是,您可以通过使用字符类(例如s
)及其否定(S
)来解决它,如下所示:
[sS]
因此,在您的情况下,正则表达式将变为:
/<div class="box-content-5">[sS]*<h1>([^<]+?)</h1>/i
从ES2018开始,JavaScript支持s
(DotAll)标志,因此在现代环境中,您的正则表达式可以与您编写的一样,但在末尾带有s
标志(而不是m
;m
更改^
和$
的工作方式,而不是.
):
/<div class="box-content-5">.*<h1>([^<]+?)</h1>/is
相关文章