两个标记之间的JavaScript正则表达式多行文本

2022-06-20 00:00:00 regex javascript

我编写了一个正则表达式以从HTML获取字符串,但似乎多行标志不起作用。

这是我的模式,我想获取h1标记中的文本。

var pattern= /<div class="box-content-5">.*<h1>([^<]+?)</h1>/mi
m = html.search(pattern);
return m[1];

我创建了一个字符串来测试它。当字符串包含" ,则结果始终为空。如果删除所有 "s,它给了我正确的结果,无论有没有/m标志。

我的正则表达式有什么问题?


解决方案

您正在寻找/.../s修饰符,也称为doTall修饰符。它强制点.也匹配换行符,而它默认情况下不会这样做。

坏消息是它<%s>不存在于(从ES2018开始,见下文)。好消息是,您可以通过使用字符类(例如s)及其否定(S)来解决它,如下所示:

[sS]

因此,在您的情况下,正则表达式将变为:

/<div class="box-content-5">[sS]*<h1>([^<]+?)</h1>/i

从ES2018开始,JavaScript支持s(DotAll)标志,因此在现代环境中,您的正则表达式可以与您编写的一样,但在末尾带有s标志(而不是mm更改^$的工作方式,而不是.):

/<div class="box-content-5">.*<h1>([^<]+?)</h1>/is

相关文章