正则表达式!启动!
正则表达式与元字符
1.定义:
😎一个String对象的字符序列中具有特殊意义的字符叫做 元字符 !
😮正则表达式是一个String对象的字符序列
public boolean matches(String regex); // 判断String对象的字符序列是否和参数regex的正则表达式匹配
常用元字符表😍
正则表达式 |
意义 |
---|---|
. | 表示任何一个字符 |
\\. | 代表 . 这个字符 |
\\d | 0 ~ 9 任何一个数字 |
\\D | 非数字字符 |
\\s | 空格类字符,例 \t \n \x0B(垂直制表符) \f(换页符) \r(回车符) |
\\S | 非空格类 |
\\w | 可用于标识符的字符 |
\\W | 不能用于标识符 |
\\p{Lower} | 小写a ~ z |
\\p{Upper} | 大写A ~ Z |
\\p{ASCII} | ASCII码 |
\\p{Alpha} | 字母 |
\\p{Digit} | 0 ~ 9 任何数字 |
\\p{Alnum} | 数字或者字母 |
\\p{Punct} | 标点符号:键盘上面你能在数字和字母外打出来符号 |
\\p{Graph} | 可视标点:\p{Alnum} \p{Punct} |
\\p{Print} | 可打印的 |
\\p{Blank} | 空格或者制表符 |
\\p{Cntrl} | 控制符:[\x00 ~\x1F\x7F] (附表1附加解释) |
补充说明
🤐
\\d 与 \\p{Digit} 不同之处在于 >>> 前者匹配的是ASCII码,而后者匹配的是Unicode码。也就是说别的语言的数字也可以匹配("一二三"✔)
\\p{Alpha} 也一样匹配Unicode码
用方括号表示一个元字符👍 (最常用)
基础用法
- [abc]:代表a,b,c中的任何一个
- [^abc]:除去a,b,c中的任何一个
- [a-zA-Z]:英文字母
- [a-d]:a ~ d任何一个
交·并·差
🤤
- [a-d[m-p]]:
a ~ d
或者m ~ p
- [a-z&&[def]]:
取交集
- [a-f&&[^bc]]:
两个集合的差值
限定修饰符🤯
总结
元字符
和 限定修饰符
任意组合 就构成了 正则表达式!
❤️ 欢迎你的到来! ❤️