当前播放: 67 | 结合正则表达式爬取图片链接
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
课程目录
第一章 :Python介绍和安装 (3讲)
01 | Python语言的特点
免费
02 | Python的发展历史与版本
免费
03 | Python的安装
免费
第二章 :Python基础语法 (3讲)
04 | Python程序的书写规则
免费
05 | 基础数据类型
免费
06 | 变量的定义和常用操作
免费
第三章 :序列 (5讲)
07 | 序列的概念
08 | 字符串的定义和使用
09 | 字符串的常用操作
10 | 元组的定义和常用操作
11 | 列表的定义和常用操作
第四章 :条件与循环 (5讲)
12 | 条件语句
13 | for循环
14 | while循环
15 | for循环语句中的if嵌套
16 | while循环语句中的if嵌套
第五章 :映射与字典 (2讲)
17 | 字典的定义和常用操作
18 | 列表推导式与字典推导式
第六章 :文件和输入输出 (2讲)
19 | 文件的内建函数
20 | 文件的常用操作
第七章 :错误和异常 (1讲)
21 | 异常的检测和处理
第八章 :函数 (11讲)
22 | 函数的定义和常用操作
23 | 函数的可变长参数
24 | 函数的变量作用域
25 | 函数的迭代器与生成器
26 | Lambda表达式
27 | Python内建函数
28 | 闭包的定义
29 | 闭包的使用
30 | 装饰器的定义
31 | 装饰器的使用
32 | 自定义上下文管理器
第九章 :模块 (1讲)
33 | 模块的定义
第十章 :语法规范 (1讲)
34 | PEP8编码规范
第十一章 :面向对象编程 (4讲)
35 | 类与实例
36 | 如何增加类的属性和方法
37 | 类的继承
38 | 类的使用-自定义with语句
第十二章 :多线程编程 (2讲)
39 | 多线程编程的定义
40 | 经典的生产者和消费者问题
第十三章 :标准库 (10讲)
41 | Python标准库的定义
42 | 正则表达式库re
43 | 正则表达式的元字符
44 | 正则表达式分组功能实例
45 | 正则表达式库函数match与search的区别
46 | 正则表达式库替换函数sub()的实例
47 | 日期与时间函数库
48 | 数学相关库
49 | 使用命令行对文件和文件夹操作
50 | 文件与目录操作库
第十四章 :机器学习库 (12讲)
51 | 机器学习的一般流程与NumPy安装
52 | NumPy的数组与数据类型
53 | NumPy数组和标量的计算
54 | NumPy数组的索引和切片
55 | pandas安装与Series结构
56 | Series的基本操作
57 | Dataframe的基本操作
58 | 层次化索引
59 | Matplotlib的安装与绘图
60 | 机器学习分类的原理
61 | Tensorflow的安装
62 | 根据特征值分类的模型和代码
第十五章 :爬虫 (8讲)
63 | 网页数据的采集与urllib库
64 | 网页常见的两种请求方式get和post
65 | HTTP头部信息的模拟
66 | requests库的基本使用
67 | 结合正则表达式爬取图片链接
68 | Beautiful Soup的安装和使用
69 | 使用爬虫爬取新闻网站
70 | 使用爬虫爬取图片链接并下载图片
第十六章 :综合案例 (1讲)
71 | 如何分析源代码并设计合理的代码结构&结课测试
67 | 结合正则表达式爬取图片链接

67 | 结合正则表达式爬取图片链接

尹会生
金山西山居运维总监
全集19942
新人首单 ¥49.9 原价 ¥199
6
本节摘要

课程源码、课件及课后作业地址:

https://github.com/wilsonyin123/geekbangpython

HTML 详细教程请参考:

https://developer.mozilla.org/zh-CN/docs/learn/HTML

展开
登录 后留言

精选留言(6)

  • 从前慢
    老师您好,我想问问写正则表达式的时候有什么需要注意的,我写的正则表达式为什么匹配很长时间都得不出结果

    作者回复: 正则表达式是个很大的话题,完整掌握给你推荐两本书《python核心编程》第三版,《正则表达式》方便你系统学习。我说下我的经验,我在第一次接触的时候忽略掉了那些我不需要的信息也要用.*方式匹配,导致匹配失败,另一个是*号有正则贪婪性,尽可能多的匹配,它们是我学习的第一个鸿沟,第二个是元字符覆盖的范围经常匹配过长,其实现在有很多在线正则表达式测试网页,方便你来查看你匹配的是否正确,希望能对你学习正则表达式有帮助。

    2018-08-06
    2
  • MarDino
    老师您好我想问下在re.compile那一行,最后面的re.S是什么意思呢?

    作者回复: re.S叫做单行模式,简单来说,就是你用正则要匹配的内容在多行里,会增加你要匹配的难度,这时候使用re.S把每行最后的换行符\n当做正常的一个字符串来进行匹配的一种小技巧

    2019-03-05
    1
  • 大包
    正则还是记不住啊。
    2020-03-22
  • o0oi1i
    打卡67
    2020-02-28
  • 我是,露莹
    老师您好,接上一条问题。title前面也用.*?的话,假设前面的<a href...>中也有个data = "title", 如下:
    < a href="http://www.cnu.cc/works/350775" class="thumbnail" data="title">
    <div class="title">天真有邪</div>
    那么我们第二个()中不就匹配出<div class="title">天真有邪,而不仅仅是天真有邪,对吗?

    作者回复: 正解,要根据实际情况(不同的网页格式、内容)调整正则的匹配规则。不可死记硬背

    2019-05-01
  • 我是,露莹
    老师您好,这里面titile前面为什么也要加上.*?还是不太明白,能否详细解释下呢?
    2019-05-01
    1
收起评论
看过的人还看
趣谈网络协议

刘超  网易研究院云计算技术部首席架构师

51讲 | 45317 人已学习

新人首单 ¥19.9 原价 ¥99
Python核心技术与实战

景霄  Facebook资深工程师

47讲 | 17382 人已学习

新人首单 ¥19.9 原价 ¥99
左耳听风

陈皓  网名“左耳朵耗子”,资深技术专家,骨灰级程序员

109讲 | 45983 人已学习

新人首单 ¥69.9 原价 ¥299
从0开始学架构

李运华  前阿里资深技术专家

60讲 | 45676 人已学习

新人首单 ¥29.9 原价 ¥129