首页 > 编程 > Python > 正文

Java及python正则表达式详解

2020-02-16 11:20:49
字体:
来源:转载
供稿:网友

正则表达式语法及常用元字符:

正则表达式有元字符及不同组合来构成,通过巧妙的构造正则表达式可以匹配任意字符串,并完成复杂的字符串处理任务。

常用的元字符有:

其中在使用反斜线时要注意:如果以‘/'开头的元字符与转义字符相同,则需要使用‘//'或者原始字符串,在字符串前面加上字符‘r'或‘R'。原始字符串可以减少用户的输入,主要用于‘//',主要用于正则表达式和文件路径字符串,如果字符串以一个‘/'结束,则需要多加一个斜线,以‘//'结束。

/  :将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'/n' 匹配一个换行符。序列 '//' 匹配 "/" 而 "/(" 则匹配 "("。

常用正则表达式的写法:

‘[a-zA-Z0-9]':匹配字母或数字
‘[^abc]':匹配除abc之外的字母
‘p(ython|erl)'匹配Python和perl
‘(pattern)*'匹配0次或多次
‘(pattern)+'匹配1次或多次
‘(pattern){m,n}'匹配m_n次
‘(a|b)*c'匹配0-n次a或b后面紧跟c
‘^[a-zA-Z]{1}([a-zA-Z0-9/._]){4,19}$'匹配20个字符以字母开始
‘^(/w){6,20}$'匹配6-20个单词字符
‘^/d{1,3}/./d{1,3}/./d{1,3}/./d{1,3}$'匹配IP
‘^[a-zA-Z]+$'检查字符中只包含英文字母
‘/w+@(/w+/.)/w+$'匹配邮箱
‘[/u4e00-/u9fa5]'匹配汉字
‘^/d{18|/d{15}$'匹配身份证
‘/d{4}-/d{1,2}-/d{1,2}'匹配时间
‘^(?=.*[a-z])(?=.*[A-Z])(?=.*/d)(?=.*[,._]).{8,}$)'判断是否为强密码
‘(.)//1+'匹配任意字符的一次或多次出现

re模块常用方法介绍:

compile(pattern[,flags])创建模式对象
search(pattern,string[,flags])在整个字符中寻找模式,返回match对象或者None
match(pattern,string[,flags])从字符串的开始处于匹配模式,返回匹配对象
findall(pattern,string[,flags]):列出匹配模式中的所有匹配项
split(pattern,string[,maxsplit=0])根据匹配模式分割字符串
sub(pat,repl,string[,count=0])将字符串中所有pat匹配项用repl替换
escape(string)将字符中的所有特殊正则表达式字符转义

match,search,findall区别

match在字符串开头或指定位置进行搜索,模式必须出现在开头或指定位置;
search方法在整个字符串或指定位置进行搜索;
findall在字符串中查找所有符合正则表达式的字符串并以列表返回。

子模式与match对象

正则表达式中match和search方法匹配成功后都会返回match对象,其中match对象的主要方法有group()(返回匹配的一个或多个子模式内容),groups()(方法返回一个包含匹配所有子模式内容的元组),groupdict()(方法返回一个包含匹配所有子模式内容的字典),start()(返回子模式内容的起始位置),end()(返回子模式内容的结束位置)span()(返回包含指定子模式内容起始位置和结束位置前一个位置的元组)

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表