正则表达式需兼顾Windows和Linux路径差异:Windows支持盘符(如C:)和分隔符或/,Linux仅用/且无盘符;应使用[/]+匹配分隔符,^([a-zA-Z]:[/]|/)?提取绝对路径前缀,1+匹配路径段,(?:^|[/])(2+)(?=[/]|$)提取目录名,(.[^/]+)?$捕获扩展名,并需防范目录穿越等安全风险。/ ↩/ ↩
正则表达式能有效提取路径中的关键成分,但需根据实际结构设计模式,避免过度匹配或遗漏边界情况。
不同系统使用不同分隔符:Windows 用 或 /,Unix/Linux/macOS 用 /。正则中需转义反斜杠(),或统一用 [/] 兼容双斜杠和正斜杠。
[^/]+(非分隔符的连续字符)(?:^|/)([^/]+)(?=/|$),利用正向先行断言避开末尾文件名^([a-zA-Z]:) 可捕获 C: 类前缀文件名常含点号,但并非所有点都表示扩展名(如 my.file.txt vs .gitignore)。稳妥做法是只取最后一个点之后的部分作为扩展名。
^(.*?)(?:.[^./]*|/|s|$) 配合全局匹配更可靠([^/]+).([^/]+)$ 匹配末尾 name.ext,但要求路径以扩展名结尾([^/]+)(?:.([^/]+))?$,第二组可为空相对路径(../、./)、通配符(*、?)、环境变量(%USERPROFILE%、$HOME)需单独适配。
b.{2}b 或 (?:^|/)(.{2})(?=/|$)
%(w+)% 或 $(w+)
[^/]*[*?][^/]* 定位含通配符的段正则解析路径不能替代系统 API 的路径规范化(如 os.path.normpath()),尤其涉及 ..、. 或空段时易出错。
.* 匹配整个路径——易跨段误匹配^[a-zA-Z]:[/]|^/ 判断是否为绝对路径