python正则表达式实用例子
基础不提了,实际当中所遇到的问题需要解决才有意义。
1,匹配整个单词(单词边界):cat
2,匹配数字:d+ d+? 改进后:d++
3,匹配HTML:<html>(?>.*?<head>)(?>.*?<title>)(?>.*?</title>)(?>.*?</head>)(?>.*?<body[^>]*>)(?>.*?</body>).*?</html>
4,python常用写法:
reobj=re.compile("regex pattern")
if reobj.search(subject):
#successful
else:
#failed
5,查找多个单词,彼此之间可以是任意距离:A(?=.*?word1)(?=.*?word2).*
6,查找重复单词:([A-Z]+)s+1
7,删除重复的文本行:
方法1:先对文本排序然后删除相邻的重复行
^(.*)(?:(?: ? | )1))+$
方法2:在未排序的文件中保留每个重复行的最后一次出现
^([^ ]*)(?: ? | )(?=.*^1$)
方法3:在未排序的文件中保留每个重复行的第一次出现
^([^ ]*)$(.*?)(?:(?: ? | )1$)+
8,匹配包含某个单词的整行内容:^.*word.*$ 多个单词:^.*(one|two|three).*$
9,匹配必须包含某几个单词的整行内容:^(?=.*?one)(?=.*?two)(?=.*?three).+$
10,匹配不包含某个单词的整行:^(?:(?!word).)*$
11,把重复的空白替换为单个空格:s+
12,在文本中查找任意的十进制整数:[0-9]+
阅读更多
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
- 上一篇:没有了
- 下一篇:没有了