正则表达式(regular Expresssion):符合一定规则的表达式
作用:用于专门操作字符串
一:
\n :代表换行符
\t:代表制表符
\\:代表本身
\^, \&,\, \(,\), \{,\}, \?
\+, \*, \|, \[, \]匹配这些字符本身
二:标准字符集合
\d:任意一个数字,0-9中的任意一个
\w:任意一个字母或下划线,也就是A~Z,a~z,0~9,_中任意一个
\s:包括空格,制表符,换行符等空白字符的其中任意一个
.:小数点可以匹配任意一个字符
三:自定义字符集合:
[]方括号匹配方式,能够匹配方括号中任意一个字符
-正则表达式的特殊符号,被包含到中括号中,则失去特殊意义,除了^,-之外
-标准字符集合,出小数点外,如果被包含于中括号中,自定义字符集合将包含该集合。
比如:[\d.\-+]将匹配数字、小数点、+、-
四:量词
-修饰匹配次数的特殊符号
{n}:表达式重复n次
{m,n}:表达式最少重复m次,最多重复n次
{m,}:表达式最少重复m次
?:匹配表达式0次或1次,相当于{0,1}
+ :表达式最少出现一次,相当于{1,}
* :表达式不出现或出现任意次,相当于{0,}
-匹配次数中的贪婪模式(匹配字符越多越好,默认)
-匹配次数中的非贪婪模式(匹配次数越少越好,修饰匹配次数的特殊符号后再加上一个“?”号)
五:字符边界
(本组标记匹配的不是字而是位置,符合某种条件的位置)
^ :与字符串开始的地方匹配
& :与字符串结束的的地方匹配
\b:匹配一个单词边界
-\b匹配这样一个位置:前面的字符和后面的字符不全是\w
六:正则表达式的匹配模式
-IGNORECASE:忽略大小写模式
-匹配时忽略大小写
-默认情况下,正则表达式是要区分大小写的
-SINGLELINE:单行模式:
-整个文件看作一个字符串,只有一个开头,一个结尾
-使小数点”.”可以匹配包含换行符(\n)在内的任意字符
-MULTILINE:多行模式
-每行都是一个字符串,都有开头和结尾
-在指定了MULTILINE之后,如果需要仅匹配字符串开始和结束位置,可以使用\A和\Z