常用正则以及正则学习(整理)

tsvico Lv5

正则总是学了忘,忘了学,每次用到不得不求助于搜索引擎,记录一下语法规则以及常用的正则

前言

在正文开始前,先推荐一个网站,是 git 上的一个开源项目,如果喜欢可以给作者一个 Star , 网站截图如下

正则大全

有关地址

https://any86.github.io/any-rule/

git 地址 https://github.com/any86/any-rule

语法规则

字符组

可以使用 [] 来寻找一组字符

例如 /p[aeiou]t/g 匹配一个 p,后跟一个元音,然后是一个 t

tvGyxH.png

更直观的匹配方式 /[a-z]/g/[A-Za-z0-9_-]/g

当然括号中也可以表示否定含义,例如 /p[^aeiou]t/g

tvGjoV.png


预定义类

  • \d 表示匹配数字 0-9,等价于 [0-9]

  • \D\d 的反面,相当于 [^0-9]

  • \w 匹配单词字符

    • 小写字母 a-z
    • 大写字母 A-Z
    • 数字 0-9
    • 下划线 _
    • 等价于 [a-zA-Z0-9_]
  • \W 匹配非单词字符 等价于 [^a-zA-Z0-9_]

  • . 等价于 [^\r\n] 除了回车和换行之外的所有字符

  • \s 匹配空白字符,支持大部分的如下字符

    • 空格、\t、回车
  • \S 匹配所有非空字符

  • 当我们想匹配一些有特殊含义的字符时,比如 |[,]+.^ 等等,需要对其使用 \ 转义字符,避免正则表达式的识别

    tvYi9S.png

    tvYl3F.png

修饰符

  • /g global, 表示全文匹配

  • /i ignore 表示忽略大小写

  • /m 多行匹配

    修饰符可以组合使用 例如 /gi

    tv3x00.png

捕获组

捕获组用(…)表示

  • /a(bcd)e/g

    tvYj8U.png

    回溯

    回溯允许引用之前捕获的子字符串。

    匹配第一组可以使用 \1,匹配第二组可以使用 \2,依此类推

    /([abc])×\1×\1/g

    tvtPV1.png

量词(表示匹配内容的个数)

  • ? 出现 0/1 次 eg: /a?/g

  • +: 匹配 1 个或多个标记 eg:/a+/g

  • *: 出现任意次

  • {n}: 出现 n 次

    匹配大写的六个字符的十六进制颜色代码

    /#[0-9A-F]{6}/g

  • {n,m}: 出现了 n-m 次

  • {n,}: 出现了至少 n 次

贪婪模式的注意事项

正则表达式默认使用贪婪模式。在贪婪模式下,会尽可能多的匹配符合要求的字符。

  • /".*"/g

    img

    重复操作符(?,*,+,…)后面添加 ,可以让匹配变 “懒”。

  • /".*?"/g

    tvd8Ts.png

    在这里,这也可以通过使用 [^"] 代替。

  • /"[^"]*"/g

    tvdD0J.png

匹配位置

  • 行首 ^ ,在 [] 中表示取反
  • 行尾 $
  • 字边界 \b,字边界锚点 \b,匹配字符和非词字符之间存在的假想不可见字符。

断言

零宽断言可用于验证条件,而不匹配任何文本。

  • 先行断言(lookhead)

    • 正向 (?=…)

      > `/_(?=[aeiou])/g`
      
    • 负向(?!…)

  • 先行断言(lookbehind)

    • 正向 (?<=…)
    • 负向(?<!…)

常用正则(例子)

带引号的字符串

1
/(['"])(?:(?!\1).)*\1/g

百分比

/^(?:100(?:\.0+)?|\d?\d(?:\.\d+)?)%$/g

火车车次

1
/^[GCDZTSPKXLY1-9]\d{1,4}$/

手机机身码 (IMEI)

1
/^\d{15,17}$/

必须带端口号的网址 (或 ip)

1
/^((ht|f)tps?:\/\/)?[\w-]+(\.[\w-]+)+:\d{1,5}\/?$/

网址 (url, 支持端口和”?+ 参数” 和”#+ 参数)

1
/^(((ht|f)tps?):\/\/)?[\w-]+(\.[\w-]+)+([\w.,@?^=%&:/~+#-]*[\w@?^=%&/~+#-])?$/

统一社会信用代码

1
/^[0-9A-HJ-NPQRTUWXY]{2}\d{6}[0-9A-HJ-NPQRTUWXY]{10}$/

迅雷链接

1
/^thunderx?:\/\/[a-zA-Z\d]+=$/

ed2k 链接 (宽松匹配)

1
/^ed2k:\/\/\|file\|.+\|\/$/

磁力链接 (宽松匹配)

1
/^magnet:\?xt=urn:btih:[0-9a-fA-F]{40,}.*$/

子网掩码

1
/^(?:\d{1,2}|1\d\d|2[0-4]\d|25[0-5])(?:\.(?:\d{1,2}|1\d\d|2[0-4]\d|25[0-5])){3}$/

linux” 隐藏文件” 路径

1
/^\/(?:[^/]+\/)*\.[^/]*/

linux 文件夹路径

1
/^\/(?:[^/]+\/)*$/

linux 文件路径

1
/^\/(?:[^/]+\/)*[^/]+$/

window” 文件夹” 路径

1
/^[a-zA-Z]:\\(?:\w+\\?)*$/

window 下” 文件” 路径

1
/^[a-zA-Z]:\\(?:\w+\\)*\w+\.\w+$/

股票代码 (A 股)

1
/^(s[hz]|S[HZ])(000[\d]{3}|002[\d]{3}|300[\d]{3}|600[\d]{3}|60[\d]{4})$/

大于等于 0, 小于等于 150, 支持小数位出现 5, 如 145.5, 用于判断考卷分数

1
/^150$|^(?:\d|[1-9]\d|1[0-4]\d)(?:.5)?$/

html 注释

1
/^<!--[\s\S]*?-->$/

md5 格式 (32 位)

1
/^([a-f\d]{32}|[A-F\d]{32})$/

版本号 (version) 格式必须为 X.Y.Z

1
/^\d+(?:\.\d+){2}$/

视频 (video) 链接地址(视频格式可按需增删)

1
/^https?:\/\/(.+\/)+.+(\.(swf|avi|flv|mpg|rm|mov|wav|asf|3gp|mkv|rmvb|mp4))$/i

图片 (image) 链接地址(图片格式可按需增删)

1
/^https?:\/\/(.+\/)+.+(\.(gif|png|jpg|jpeg|webp|svg|psd|bmp|tif))$/i

24 小时制时间(HH:mm:ss)

1
/^(?:[01]\d|2[0-3]):[0-5]\d:[0-5]\d$/

12 小时制时间(hh:mm:ss)

1
/^(?:1[0-2]|0?[1-9]):[0-5]\d:[0-5]\d$/

base64 格式

1
/^\s*data:(?:[a-z]+\/[a-z0-9-+.]+(?:;[a-z-]+=[a-z0-9-]+)?)?(?:;base64)?,([a-z0-9!$&',()*+;=\-._~:@/?%\s]*?)\s*$/i

数字 / 货币金额(支持负数、千分位分隔符)

1
/^-?\d+(,\d{3})*(\.\d{1,2})?$/

数字 / 货币金额 (只支持正数、不支持校验千分位分隔符)

1
/(?:^[1-9]([0-9]+)?(?:\.[0-9]{1,2})?$)|(?:^(?:0){1}$)|(?:^[0-9]\.[0-9](?:[0-9])?$)/

银行卡号(10 到 30 位,覆盖对公 / 私账户,参考微信支付

1
/^[1-9]\d{9,29}$/

中文姓名

1
/^(?:[\u4e00-\u9fa5·]{2,16})$/

英文姓名

1
/(^[a-zA-Z]{1}[a-zA-Z\s]{0,20}[a-zA-Z]{1}$)/

车牌号 (新能源)

1
/[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领 A-Z]{1}[A-HJ-NP-Z]{1}(([0-9]{5}[DF])|([DF][A-HJ-NP-Z0-9][0-9]{4}))$/

车牌号 (非新能源)

1
/^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领 A-Z]{1}[A-HJ-NP-Z]{1}[A-Z0-9]{4}[A-Z0-9挂学警港澳]{1}$/

车牌号 (新能源 + 非新能源)

1
/^(?:[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领 A-Z]{1}[A-HJ-NP-Z]{1}(?:(?:[0-9]{5}[DF])|(?:[DF](?:[A-HJ-NP-Z0-9])[0-9]{4})))|(?:[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领 A-Z]{1}[A-Z]{1}[A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9 挂学警港澳]{1})$/

手机号 (mobile phone) 中国 (严谨), 根据工信部 2019 年最新公布的手机号段

1
/^(?:(?:\+|00)86)?1(?:(?:3[\d])|(?:4[5-7|9])|(?:5[0-3|5-9])|(?:6[5-7])|(?:7[0-8])|(?:8[\d])|(?:9[1|8|9]))\d{8}$/

手机号 (mobile phone) 中国 (宽松), 只要是 13,14,15,16,17,18,19 开头即可

1
/^(?:(?:\+|00)86)?1[3-9]\d{9}$/

手机号 (mobile phone) 中国 (最宽松), 只要是 1 开头即可,如果你的手机号是用来接收短信,优先建议选择这一条

1
/^(?:(?:\+|00)86)?1\d{10}$/

date (日期)

1
/^\d{4}(-)(1[0-2]|0?\d)\1([0-2]\d|\d|30|31)$/

email (邮箱)

1
/^(([^<>()[\]\\.,;:\s@"]+(\.[^<>()[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/

座机 (tel phone) 电话 (国内), 如: 0341-86091234

1
/^\d{3}-\d{8}$|^\d{4}-\d{7,8}$/

身份证号 (1 代,15 位数字)

1
/^[1-9]\d{7}(?:0\d|10|11|12)(?:0[1-9]|[1-2][\d]|30|31)\d{3}$/

身份证号 (2 代,18 位数字), 最后一位是校验位,可能为数字或字符 X

1
/^[1-9]\d{5}(?:18|19|20)\d{2}(?:0[1-9]|10|11|12)(?:0[1-9]|[1-2]\d|30|31)\d{3}[\dXx]$/

身份证号,支持 1/2 代 (15 位 / 18 位数字)

1
/(^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$)|(^\d{6}(18|19|20)\d{2}(0[1-9]|10|11|12)([0-2]\d|30|31)\d{3}(\d|X|x)$)/

护照(包含香港、澳门)

1
/(^[EeKkGgDdSsPpHh]\d{8}$)|(^(([Ee][a-fA-F])|([DdSsPp][Ee])|([Kk][Jj])|([Mm][Aa])|(1[45]))\d{7}$)/

帐号是否合法 (字母开头,允许 5-16 字节,允许字母数字下划线组合

1
/^[a-zA-Z]\w{4,15}$/

中文 / 汉字

1
/^(?:[\u3400-\u4DB5\u4E00-\u9FEA\uFA0E\uFA0F\uFA11\uFA13\uFA14\uFA1F\uFA21\uFA23\uFA24\uFA27-\uFA29]|[\uD840-\uD868\uD86A-\uD86C\uD86F-\uD872\uD874-\uD879][\uDC00-\uDFFF]|\uD869[\uDC00-\uDED6\uDF00-\uDFFF]|\uD86D[\uDC00-\uDF34\uDF40-\uDFFF]|\uD86E[\uDC00-\uDC1D\uDC20-\uDFFF]|\uD873[\uDC00-\uDEA1\uDEB0-\uDFFF]|\uD87A[\uDC00-\uDFE0])+$/

小数

1
/^\d+\.\d+$/

数字

1
/^\d{1,}$/

html 标签 (宽松匹配)

1
/<(\w+)[^>]*>(.*?<\/\1>)?/

qq 号格式正确

1
/^[1-9][0-9]{4,10}$/

数字和字母组成

1
/^[A-Za-z0-9]+$/

英文字母

1
/^[a-zA-Z]+$/

小写英文字母组成

1
/^[a-z]+$/

大写英文字母

1
/^[A-Z]+$/

密码强度校验,最少 6 位,包括至少 1 个大写字母,1 个小写字母,1 个数字,1 个特殊字符

1
/^\S*(?=\S{6,})(?=\S*\d)(?=\S*[A-Z])(?=\S*[a-z])(?=\S*[!@#$%^&*? ])\S*$/

用户名校验,4 到 16 位(字母,数字,下划线,减号)

1
/^[a-zA-Z0-9_-]{4,16}$/

ip-v4

1
/^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/

ip-v6

1
/^((([0-9A-Fa-f]{1,4}:){7}[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){6}:[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){5}:([0-9A-Fa-f]{1,4}:)?[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){4}:([0-9A-Fa-f]{1,4}:){0,2}[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){3}:([0-9A-Fa-f]{1,4}:){0,3}[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){2}:([0-9A-Fa-f]{1,4}:){0,4}[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){6}((\b((25[0-5])|(1\d{2})|(2[0-4]\d)|(\d{1,2}))\b)\.){3}(\b((25[0-5])|(1\d{2})|(2[0-4]\d)|(\d{1,2}))\b))|(([0-9A-Fa-f]{1,4}:){0,5}:((\b((25[0-5])|(1\d{2})|(2[0-4]\d)|(\d{1,2}))\b)\.){3}(\b((25[0-5])|(1\d{2})|(2[0-4]\d)|(\d{1,2}))\b))|(::([0-9A-Fa-f]{1,4}:){0,5}((\b((25[0-5])|(1\d{2})|(2[0-4]\d)|(\d{1,2}))\b)\.){3}(\b((25[0-5])|(1\d{2})|(2[0-4]\d)|(\d{1,2}))\b))|([0-9A-Fa-f]{1,4}::([0-9A-Fa-f]{1,4}:){0,5}[0-9A-Fa-f]{1,4})|(::([0-9A-Fa-f]{1,4}:){0,6}[0-9A-Fa-f]{1,4})|(([0-9A-Fa-f]{1,4}:){1,7}:))$/i

16 进制颜色

1
/^#?([a-fA-F0-9]{6}|[a-fA-F0-9]{3})$/

微信号 (wx),6 至 20 位,以字母开头,字母,数字,减号,下划线

1
/^[a-zA-Z][-_a-zA-Z0-9]{5,19}$/

邮政编码 (中国)

1
/^(0[1-7]|1[0-356]|2[0-7]|3[0-6]|4[0-7]|5[1-7]|6[1-7]|7[0-5]|8[013-6])\d{4}$/

中文和数字

1
/^((?:[\u3400-\u4DB5\u4E00-\u9FEA\uFA0E\uFA0F\uFA11\uFA13\uFA14\uFA1F\uFA21\uFA23\uFA24\uFA27-\uFA29]|[\uD840-\uD868\uD86A-\uD86C\uD86F-\uD872\uD874-\uD879][\uDC00-\uDFFF]|\uD869[\uDC00-\uDED6\uDF00-\uDFFF]|\uD86D[\uDC00-\uDF34\uDF40-\uDFFF]|\uD86E[\uDC00-\uDC1D\uDC20-\uDFFF]|\uD873[\uDC00-\uDEA1\uDEB0-\uDFFF]|\uD87A[\uDC00-\uDFE0])|(\d))+$/

不能包含字母

1
/^[^A-Za-z]*$/

java 包名

1
/^([a-zA-Z_][a-zA-Z0-9_]*)+([.][a-zA-Z_][a-zA-Z0-9_]*)+$/

mac 地址

1
/^((([a-f0-9]{2}:){5})|(([a-f0-9]{2}-){5}))[a-f0-9]{2}$/i

匹配连续重复的字符

1
/(.)\1+/

学习于 https://juejin.im/post/5eb4285e6fb9a0434d70a3de?utm_source=gold_browser_extension#heading-13

  • 标题: 常用正则以及正则学习(整理)
  • 作者: tsvico
  • 创建于 : 2020-06-13 12:43:59
  • 更新于 : 2022-05-22 16:05:38
  • 链接: https://blog.tbox.fun/2020/b59f7188.html
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论
目录
常用正则以及正则学习(整理)