零基础学 Python（2018 版）

尹会生

前游戏公司技术总监，前新浪网技术经理

80146 人已学习

新⼈⾸单¥68

课程目录

已完结/共 72 讲

第一章：Python介绍和安装 (3讲)



01 | Python语言的特点

时长 10:26

02 | Python的发展历史与版本

时长 09:15

03 | Python的安装

时长 05:21

第二章：Python基础语法 (3讲)



04 | Python程序的书写规则

时长 02:57

05 | 基础数据类型

时长 04:11

06 | 变量的定义和常用操作

时长 09:10

第三章：序列 (5讲)



时长 08:08

时长 03:42

时长 03:00

时长 09:44

时长 03:05

第四章：条件与循环 (5讲)



时长 08:25

时长 05:09

时长 05:49

时长 08:12

时长 04:13

第五章：映射与字典 (2讲)



17 | 字典的定义和常用操作

时长 10:19

18 | 列表推导式与字典推导式

时长 05:06

第六章：文件和输入输出 (2讲)



19 | 文件的内建函数

时长 08:24

20 | 文件的常用操作

时长 08:32

第七章：错误和异常 (1讲)



21 | 异常的检测和处理

时长 14:53

第八章：函数 (11讲)



时长 21:51

时长 07:43

时长 02:50

时长 07:16

时长 05:02

时长 10:30

时长 10:15

时长 05:43

时长 06:58

时长 08:15

时长 02:42

第九章：模块 (1讲)



33 | 模块的定义

时长 06:47

第十章：语法规范 (1讲)



34 | PEP8编码规范

时长 07:16

第十一章：面向对象编程 (4讲)



时长 09:18

时长 06:18

时长 20:37

时长 06:31

第十二章：多线程编程 (2讲)



39 | 多线程编程的定义

时长 16:16

40 | 经典的生产者和消费者问题

时长 10:29

第十三章：标准库 (10讲)



时长 03:10

时长 04:15

时长 14:12

时长 06:59

45 | 正则表达式库函数match与search的区别

时长 03:12

46 | 正则表达式库替换函数sub()的实例

时长 05:25

时长 06:46

时长 03:49

时长 08:49

时长 08:40

第十四章：机器学习库 (12讲)



51 | 机器学习的一般流程与NumPy安装

时长 06:43

52 | NumPy的数组与数据类型

时长 03:05

53 | NumPy数组和标量的计算

时长 04:44

54 | NumPy数组的索引和切片

时长 03:29

55 | pandas安装与Series结构

时长 08:18

56 | Series的基本操作

时长 04:09

57 | Dataframe的基本操作

时长 19:50

58 | 层次化索引

时长 03:44

59 | Matplotlib的安装与绘图

时长 14:07

60 | 机器学习分类的原理

时长 05:22

61 | Tensorflow的安装

时长 03:47

62 | 根据特征值分类的模型和代码

时长 10:18

第十五章：爬虫 (8讲)



63 | 网页数据的采集与urllib库

时长 06:13

64 | 网页常见的两种请求方式get和post

时长 08:10

65 | HTTP头部信息的模拟

时长 03:42

66 | requests库的基本使用

时长 03:28

67 | 结合正则表达式爬取图片链接

时长 07:23

68 | Beautiful Soup的安装和使用

时长 04:58

69 | 使用爬虫爬取新闻网站

时长 06:45

70 | 使用爬虫爬取图片链接并下载图片

时长 11:03

第十六章：综合案例 & 结课测试 (1讲)



71 | 如何分析源代码并设计合理的代码结构&结课测试

时长 18:22

特别放送 (1讲)



强势回归：零基础学Python2022版来啦！

时长 05:18



零基础学 Python（2018 版）



留言





沉浸
阅读





手机端



回顶部

当前播放: 70 | 使用爬虫爬取图片链接并下载图片

00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看



01 | Python语言的特点

02 | Python的发展历史与版本

03 | Python的安装

04 | Python程序的书写规则

05 | 基础数据类型

06 | 变量的定义和常用操作

07 | 序列的概念

08 | 字符串的定义和使用

09 | 字符串的常用操作

10 | 元组的定义和常用操作

11 | 列表的定义和常用操作

12 | 条件语句

13 | for循环

14 | while循环

15 | for循环语句中的if嵌套

16 | while循环语句中的if嵌套

17 | 字典的定义和常用操作

18 | 列表推导式与字典推导式

19 | 文件的内建函数

20 | 文件的常用操作

21 | 异常的检测和处理

22 | 函数的定义和常用操作

23 | 函数的可变长参数

24 | 函数的变量作用域

25 | 函数的迭代器与生成器

26 | Lambda表达式

27 | Python内建函数

28 | 闭包的定义

29 | 闭包的使用

30 | 装饰器的定义

31 | 装饰器的使用

32 | 自定义上下文管理器

33 | 模块的定义

34 | PEP8编码规范

35 | 类与实例

36 | 如何增加类的属性和方法

37 | 类的继承

38 | 类的使用-自定义with语句

39 | 多线程编程的定义

40 | 经典的生产者和消费者问题

41 | Python标准库的定义

42 | 正则表达式库re

43 | 正则表达式的元字符

44 | 正则表达式分组功能实例

45 | 正则表达式库函数match与search的区别

46 | 正则表达式库替换函数sub()的实例

47 | 日期与时间函数库

48 | 数学相关库

49 | 使用命令行对文件和文件夹操作

50 | 文件与目录操作库

51 | 机器学习的一般流程与NumPy安装

52 | NumPy的数组与数据类型

53 | NumPy数组和标量的计算

54 | NumPy数组的索引和切片

55 | pandas安装与Series结构

56 | Series的基本操作

57 | Dataframe的基本操作

58 | 层次化索引

59 | Matplotlib的安装与绘图

60 | 机器学习分类的原理

61 | Tensorflow的安装

62 | 根据特征值分类的模型和代码

63 | 网页数据的采集与urllib库

64 | 网页常见的两种请求方式get和post

65 | HTTP头部信息的模拟

66 | requests库的基本使用

67 | 结合正则表达式爬取图片链接

68 | Beautiful Soup的安装和使用

69 | 使用爬虫爬取新闻网站

70 | 使用爬虫爬取图片链接并下载图片

强势回归：零基础学Python2022版来啦！

71 | 如何分析源代码并设计合理的代码结构&结课测试

本节摘要

课程源码、课件及课后作业地址：

https://gitee.com/geektime-geekbang/geekbangpython

登录后留言

全部留言(17)

最新
精选

太阳在前方

老师，pachong8.py 这个代码文件在Github里没找到，能上传下吗？

作者回复: https://github.com/wilsonyin123/geekbangpython/blob/master/timegeekbang.com/pachong8.py

2018-07-06



2

kaylana

老师，写脚本控制浏览器自动登录网站，如果登陆时有滑块验证码怎么处理呢？

作者回复: 滑块认证目前没有有效的方法，使用python可以利用Selenium 模拟部分滑块操作，但是人和机器人模拟的习惯一般是不同的，体现在拖动滑块速度不一样，多数行为是逐渐加速，快到位置的时候减速，可能要配合一定的算法来实现滑块验证码的验证。

2019-06-12



1

贺敏Minbo

requests.exceptions.SSLError: HTTPSConnectionPool(host='res.infoq.com', port=443): Max retries exceeded with url: /presentations/the-way-of-product-transformation-of-technology-architecture/zh/mediumimage/yinlu270-1532435409007.jpg (Caused by SSLError(SSLError(1, '[SSL: SSLV3_ALERT_HANDSHAKE_FAILURE] sslv3 alert handshake failure (_ssl.c:645)'),))

作者回复: 增加以下设置 import requests.packages.urllib3.util.ssl_ requests.packages.urllib3.util.ssl_.DEFAULT_CIPHERS = 'ALL' 参考 https://stackoverflow.com/questions/40500193/python-3-5-use-openssl-errorssl-sslv3-alert-handshake-failure-sslv3-alert-ha 出现报错的原因是ssl协议设计缺陷导致

2018-07-30



1

HabenLiu

尹老师您好，您的课让我受益匪浅，python进阶的课程也想和您学，还有吗？

作者回复: 感谢认可，进阶课程暂时没开，给你推荐一本书《流畅的Python》，是非常知名的书，也可以多学一下Django和Flask框架。都能给你带来很大的收益

2022-01-21

2



Bonaparte

下载两页之后，出现 raise IncompleteRead(b''.join(s), amt) http.client.IncompleteRead: IncompleteRead(5043 bytes read, 3063 more expected) During handling of the above exception, another exception occurred: 是不是有下载上限哈...

作者回复: 要看出现的报错信息才能知道具体错在哪里

2020-04-22





David.cui

老师讲的太好了。虽然infoq.com的新闻版本无法抓图片了。我找了一个网站，测试了一下老师的代码，居然可以成功，太惊喜了。

作者回复: 试试英文版的网站，另外掌握方法，静态网站是通用的

2020-02-10





lllll

老师，爬取js 中的内容该怎么做？

作者回复: 用selenium+chrome来爬取

2019-08-14





Andrew

老师你好，对于爬虫的合法性我很不解，貌似几行代码就能在大牢里顿几年。课程中爬虫相关的代码也没有放在课件中，似乎这类代码是不能传播的吗？我只知道遵守robots协议就好了，但实际上大多数网站并没有这个协议。有什么规则能知道自己是否属于合法数据收集吗？

作者回复: 爬虫的合法性分两类，一类是是否违反法律法规，一种是是否违反行业标准。法律法规我不专业，建议参考各公司的用户协议和法律专业的定义。另一种robots协议是行业标准，不仅个人，搜索引擎也要遵循这个标准，不遵守会被认定为违背公认的商业道德，从而构成不正当竞争还有一种更为严重的是通过侵入或破坏计算机信息系统进行的数据抓取行为或者窃取公民隐私，这种行为是明确违反《网络安全法》的。

2019-03-11





littlePerfect

老师,查看 infoQ 网页源码看不到图片地址了,怎么破?

作者回复: 网站改版过，所以会有抓取不到图片的情况，可以鼠标右键点击图片-检查，通过浏览器的调试功能查看图片的地址，所在的<div>。。。</div>来调整代码

2019-01-21





忘江湖

用pip list命令看了一下，安装的requests版本是2.18.4的，但是仍然出现ModuleNotFoundError:No module named 'requests'的报错

作者回复: 你好，考虑两种情况会出现安装了也报找不到模块的错误 1 是否你正在编写的文件名字叫做requests.py ?在导入时会优先用你的文件作为第一搜索位置 2 命令行pip安装requests后，你运行时使用了venv环境（即和pip安装的不是同一个环境），或运行时使用了同一个系统下不同版本的python 可以从这两个方向排查一下

2019-01-16





收起评论