本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:
在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。
一、问题引入
一个在HTML页面中匹配标题标签(H1—H6)的问题:
文本:
Welcome to my pageContent is divided into twosections:
IntroductionInformation about me.
HobbyInformation about my hobby.
This is invalid HTML |
正则表达式:<[hH][1-6]>.*?[hH][1-6]>
结果:
分析:模式<[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了
二、回溯引用匹配
回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:
文本:
Welcome to my pageContent is divided into twosections:
IntroductionInformation about me.
HobbyInformation about my hobby.
This is invalid HTML |
正则表达式:<[hH]([1-6])>.*?[hH]1>
结果:
分析:首先匹配开始标题标签的模式<[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为[hH]1>,其中1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那1也匹配到1,如果匹配到2,那1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。
创造与魔法 安卓版v1.0.0750
创造与魔法是一款开放世界手游,在游戏中玩家可探索这个奇妙的世
创造与魔法修改版 最新版v1.0.0750
创造与魔法无限点券版是款探索冒险游戏,该款游戏的操作还是蛮自
战争与文明官方版本 安卓版v1.7.16
战争与文明是一款由上海邮通科技有限公司开发的战争策略游戏,这
迷你世界0元领皮肤无限迷你币版 最新安卓版v1.43.0
迷你世界0元购买皮肤版是这款开放沙盒冒险建造游戏的特殊破解版
创造与魔法无限经验版 安卓版v1.0.0750
创造与魔法无限经验版是款可以改造环境,整个游戏的自由度还是蛮