作者回复: 是空白符,感谢指正。 官方文档解释: For Unicode (str) patterns: Matches Unicode whitespace characters 官方文档位置: https://docs.python.org/3.6/library/re.html
作者回复: 正则表达式的主要作用是“匹配”同一个模式的数据,一般都是原始数据有一定的规则,但又不完全相同:例如在爬取网页里面找到所有的图片,在日志文件提取指定的字段,在用户登录界面匹配是否输入的是邮件地址格式等。
作者回复: \d 匹配单个数字 \d+ 匹配多个连续数字 \d{5} 匹配指定个数(5个)的数字
作者回复: 标准正则是这样定义的: '.'是除\n 以外可以匹配任何单个字符,但是我们在讲sed 的多行模式的时候,是可以使用“.”匹配换行符的,如 文本文件内容 a b 使用 sed 'N;s/a.b/x/' 文本文件.txt 可以进行替换
作者回复: 您好, r'ca?t' 可以匹配 cat ct r'c.t' 可以匹配 cat cbt cxt 视频我再回看一下,有问题及时更新,感谢指正
作者回复: .*?可以理解成一个固定的组合,?跟在*后边时,表示懒惰模式,也称非贪婪模式。 在能使整个匹配成功的前提下尽可能少的匹配字符。