详解Python3中的正则表达式的基本用法(6)

日期：2020-06-18 栏目：程序人生浏览：次

html = re.sub('<a.*?>|</a>', '', html) print(html) reresults = re.findall('<li.*?>(.*?)</li>', html, re.S) for result in results: print(result.strip())

运行结果：

<div> <h2>经典老歌</h2> <p> 经典老歌列表 </p> <ul> <li data-view="2">一路上有你</li> <li data-view="7"> 沧海一声笑 </li> <li data-view="4"> 往事随风 </li> <li data-view="6">光辉岁月</li> <li data-view="5">记事本</li> <li data-view="5"> 但愿人长久 </li> </ul> </div>

一路上有你
沧海一声笑
往事随风
光辉岁月
记事本
但愿人长久

可以到标签在经过sub()函数处理后都没有了，然后再findall()直接提取即可。所以在适当的时候我们可以借助于sub()方法做一些相应处理可以事半功倍。

compile()

前面我们所讲的方法都是用来处理字符串的方法，最后再介绍一个compile()方法，这个方法可以讲正则字符串编译成正则表达式对象，以便于在后面的匹配中复用。

import re content1 = '2016-12-15 12:00' content2 = '2016-12-17 12:55' content3 = '2016-12-22 13:21' pattern = re.compile('\d{2}:\d{2}') reresult1 = re.sub(pattern, '', content1) reresult2 = re.sub(pattern, '', content2) reresult3 = re.sub(pattern, '', content3) print(result1, result2, result3)

例如这里有三个日期，我们想分别将三个日期中的时间去掉，所以在这里我们可以借助于sub()方法，sub()方法的第一个参数是正则表达式，但是这里我们没有必要重复写三个同样的正则表达式，所以可以借助于compile()函数将正则表达式编译成一个正则表达式对象，以便复用。

运行结果：

2016-12-15 2016-12-17 2016-12-22

另外compile()还可以传入修饰符，例如re.S等修饰符，这样在search()、findall()等方法中就不需要额外传了。所以compile()方法可以说是给正则表达式做了一层封装，以便于我们更好地复用。

到此为止，正则表达式的基本用法就介绍完毕了，后面我们会有实战来讲解正则表达式的使用。

总结

以上所述是小编给大家介绍的Python3中的正则表达式的基本用法,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

您可能感兴趣的文章:

转载注明出处：https://www.heiqu.com/wjxjff.html

详解Python3中的正则表达式的基本用法(6)

相关推荐