网站首页 > 技术文章 正文
原书这么一句话,特别棒:正则表达式是匹配模式,要么匹配字符,要么匹配位置,要记住。
1. 两种模糊匹配
正则表达式的强大在于它的模糊匹配,这里介绍两个方向上的“模糊”:横向模糊和纵向模糊。
- 横向模糊匹配
即一个正则可匹配的字符串长度不固定,可以是多种情况。
如 /ab{2,5}c/ 表示匹配: 第一个字符是 "a" ,然后是 2 - 5 个字符 "b" ,最后是字符 "c" :
- 纵向模糊匹配
即一个正则可匹配某个不确定的字符,可以有多种可能。
如 /[abc]/ 表示匹配 "a", "b", "c" 中任意一个。
2. 字符组
- 范围表示法
可以指定字符范围,比如 [1234abcdUVWXYZ] 就可以表示成 [1-4a-dU-Z] ,使用 - 来进行缩写。
如果要匹配 "a", "-", "z" 中任意一个字符,可以这么写: [-az] 或 [a\-z] 或 [az-] 。
- 排除字符组
即需要排除某些字符时使用,通过在字符组第一个使用 ^ 来表示取反,如 [^abc] 就表示匹配除了 "a", "b", "c" 的任意一个字符。
- 常见简写形式
3. 量词
量词也称重复,常用简写如下:
- 贪婪匹配和惰性匹配
在正则 /\d{2,4}/ ,表示数字连续出现 2 - 4 次,可以匹配到 2 位、 3 位、4 位连续数字。
但是在 贪婪匹配 如 /\d{2,4}/g ,会尽可能多匹配,如超过 4 个,就只匹配 4 个,如有 3 个,就匹配 3 位。
而在 惰性匹配 如 /\d{2,4}?/g ,会 尽可能少 匹配,如超过 2 个,就只匹配 2 个,不会继续匹配下去。
4. 多选分支
即提供多个子匹配模式任选一个,使用 |(管道符)分隔,由于分支结构也是惰性,即匹配上一个后,就不会继续匹配后续的。
格式如:(r1|r2|r3),我们就可以使用 /leo|pingan/ 来匹配 "leo" 和 "pingan"。
5. 案例分析
匹配字符,无非就是字符组、量词和分支结构的组合使用。
- 十六进制颜色值匹配
- 时间和日期匹配
- Windows操作系统文件路径匹配
盘符使用 [a-zA-Z]:\\ ,这里需要注意 \ 字符需要转义,并且盘符不区分大小写;
文件名或文件夹名,不能包含特殊字符,使用 [^\\:*<>|"?\r\n/] 表示合法字符;
并且至少有一个字符,还有可以出现任意次,就可以使用 ([^\\:*<>|"?\r\n/]+\\)* 匹配任意个 文件夹\;
还有路径最后一部分可以是 文件夹 ,即没有 \ 于是表示成 ([^\\:*<>|"?\r\n/]+)?。
- id匹配
如提取
tips1:由于 . 匹配双引号,且 * 贪婪,就会持续匹配到最后一个双引号结束。
tips2:使用惰性匹配,但效率低,有回溯问题。
tips3:最终优化。
公众号:前端自习课
猜你喜欢
- 2025-03-20 正则表达式学习之替换分组练习(正则匹配并替换)
- 2025-03-20 人人都看得懂的正则表达式教程(正则表达式 详解)
- 2025-03-20 这几种正则表达式的“字符集合”,想要入门regexp函数,必须了解
- 2025-03-20 这几个冷门到你没听过的App,好用到为你打开新世界大门
- 2025-03-20 java正则-取出指定字符串之间的内容
- 2025-03-20 正则表达式 量词(正则表达式子表达式)
- 2025-03-20 Excel VBA【案例】正则表达式提取中文字符/五笔字型编码文本整理
- 2025-03-20 小心别落入正则回溯陷阱(正则表达式回溯陷阱)
- 2025-03-20 测试文章,为评论转发而生(测试评论功能)
- 2025-03-20 别再把shell中命令行的glob当做正则了
- 04-29kali2021ping 外网不通
- 04-29我是如何用这3个小工具,助力小姐姐提升100%开发效率的
- 04-29注册下载啊
- 04-29Spring 中三种 BeanName 生成器!
- 04-29mysql学习9:创建数据库
- 04-29Linux之yum源详解
- 04-29夏日终曲/请以你的名字呼唤我/Call me by your name(无剧透)
- 04-29注释竟然还有特殊用途?一文解惑 //go:linkname 指令
- 最近发表
- 标签列表
-
- cmd/c (64)
- c++中::是什么意思 (83)
- 标签用于 (65)
- 主键只能有一个吗 (66)
- sqlset (59)
- phprequire_once (61)
- localstorage.removeitem (74)
- routermode (59)
- vector线程安全吗 (70)
- & (66)
- java (73)
- org.redisson (64)
- log.warn (60)
- cannotinstantiatethetype (62)
- js数组插入 (83)
- resttemplateokhttp (59)
- gormwherein (64)
- linux删除一个文件夹 (65)
- mac安装java (72)
- reader.onload (61)
- outofmemoryerror是什么意思 (64)
- flask文件上传 (63)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)