入门客AI创业平台(我带你入门,你带我飞行)
博文笔记

python正则表达式实用例子

创建时间:2016-12-18 投稿人: 浏览次数:1718

基础不提了,实际当中所遇到的问题需要解决才有意义。

1,匹配整个单词(单词边界):cat 

2,匹配数字:d+   d+?   改进后:d++

3,匹配HTML:<html>(?>.*?<head>)(?>.*?<title>)(?>.*?</title>)(?>.*?</head>)(?>.*?<body[^>]*>)(?>.*?</body>).*?</html>

4,python常用写法:

        reobj=re.compile("regex pattern")

      if reobj.search(subject):

#successful

      else:

#failed

5,查找多个单词,彼此之间可以是任意距离:A(?=.*?word1)(?=.*?word2).*

     6,查找重复单词:([A-Z]+)s+1

7,删除重复的文本行:

方法1:先对文本排序然后删除相邻的重复行

  ^(.*)(?:(?: ? | )1))+$

方法2:在未排序的文件中保留每个重复行的最后一次出现

^([^ ]*)(?: ? | )(?=.*^1$)

方法3:在未排序的文件中保留每个重复行的第一次出现

^([^ ]*)$(.*?)(?:(?: ? | )1$)+

8,匹配包含某个单词的整行内容:^.*word.*$     多个单词:^.*(one|two|three).*$

        9,匹配必须包含某几个单词的整行内容:^(?=.*?one)(?=.*?two)(?=.*?three).+$

       10,匹配不包含某个单词的整行:^(?:(?!word).)*$

       11,把重复的空白替换为单个空格:s+

       12,在文本中查找任意的十进制整数:[0-9]+


阅读更多
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
  • 上一篇:没有了
  • 下一篇:没有了
未上传头像