dotAll(s)模式是ECMAScript 2018引入的正则标志,使.匹配包括换行符在内的任意Unicode字符,等价于[sS],仅影响.的行为,启用方式有字面量/s、构造函数's'及组合标志如/gis。
正则表达式默认情况下,.(点号)不匹配换行符(、、u2028、u2029等),这会导致跨行文本无法被完整捕获。启用 dotAll 模式(s 标志) 后,. 就能匹配包括换行符在内的任意 Unicode 字符,从而实现对多行原始数据的全量匹配。
dotAll 是 ECMAScript 2018 引入的正则标志,用 s 表示。它只影响 . 元字符的行为——让其等价于 [sS](即“任意空白或非空白字符”),而非默认的 [^u2028u2029]。注意:s 标志不会改变其他元字符(如 ^、$、d)的行为,也不影响 [sS] 或 [wW] 这类写法本身。
在 JavaScript 中有三种启用方式:
s 标志,例如 /hello.world/s
's' 作为第二个参数,例如 new RegExp('hello.world', 's')
/pattern/gis(全局、忽略大小写、dotAll)适用于需要一次性捕获跨多行结构化内容的场景,比如 HTML 片段、JSON 块、日志段落、配置块等:
<div>...</div> 标签及其内部所有内容(含换行和嵌套):/<div>(.*?)</div>/s(配合非贪婪量词更安全)/```[sS]*?```/s → 可简写为 /```.*?```/s
START 开头、END 结尾的任意多行块:/START(.*?)END/s
虽然 s 模式简化了跨行匹配,但仍需注意:
.* 而非 .*?,可能过度匹配到文档末尾或错误闭合位置[sS]
m(multiline)区别清楚:m 改变 ^ 和 $ 的行为,s 只改变 .;两者可同时使用dotAll 模式让正则真正具备处理“一段连续原始文本”的能力,尤其适合预处理阶段的粗粒度提取。只要目标格式相对规整,它比手动拼接字符串或逐行扫描更简洁可靠。