• 从前慢
    2018-08-06
    老师您好,我想问问写正则表达式的时候有什么需要注意的,我写的正则表达式为什么匹配很长时间都得不出结果

    作者回复: 正则表达式是个很大的话题,完整掌握给你推荐两本书《python核心编程》第三版,《正则表达式》方便你系统学习。我说下我的经验,我在第一次接触的时候忽略掉了那些我不需要的信息也要用.*方式匹配,导致匹配失败,另一个是*号有正则贪婪性,尽可能多的匹配,它们是我学习的第一个鸿沟,第二个是元字符覆盖的范围经常匹配过长,其实现在有很多在线正则表达式测试网页,方便你来查看你匹配的是否正确,希望能对你学习正则表达式有帮助。

    
     1
  • 我是,露莹
    2019-05-01
    老师您好,接上一条问题。title前面也用.*?的话,假设前面的<a href...>中也有个data = "title", 如下:
    < a href="http://www.cnu.cc/works/350775" class="thumbnail" data="title">
    <div class="title">天真有邪</div>
    那么我们第二个()中不就匹配出<div class="title">天真有邪,而不仅仅是天真有邪,对吗?

    作者回复: 正解,要根据实际情况(不同的网页格式、内容)调整正则的匹配规则。不可死记硬背

    
    
  • 我是,露莹
    2019-05-01
    老师您好,这里面titile前面为什么也要加上.*?还是不太明白,能否详细解释下呢?
    
    
  • MarDino
    2019-03-05
    老师您好我想问下在re.compile那一行,最后面的re.S是什么意思呢?

    作者回复: re.S叫做单行模式,简单来说,就是你用正则要匹配的内容在多行里,会增加你要匹配的难度,这时候使用re.S把每行最后的换行符\n当做正常的一个字符串来进行匹配的一种小技巧

    
    
我们在线,来聊聊吧