Python自动化办公实战课
尹会生
前游戏公司技术总监,前新浪网研发中心技术经理
立即订阅
2104 人已学习
课程目录
已更新 24 讲 / 共 33 讲
0/4登录后,你可以任选4讲全文学习。
课前必读 (2讲)
开篇词 | 重复工作这么多,怎样才能提高工作效率?
免费
导读|入门Python的必备知识
“输入”模块:不同文件类型的批量合并和拆分问题 (3讲)
01 | 拆分与合并:如何快速地批量处理内容相似的Excel?
02|善用Python扩展库:如何批量合并多个文档?
03|图片转文字:如何提高识别准确率?
春节特别放送 (3讲)
春节特别放送1|实体水果店转线上销售的数据统计问题
春节特别放送2|用自顶至底的思路解决数据统计问题
春节特别放送3|揭晓项目作业的答案
“运算”模块:扩展常用的统计、搜索和排序功能 (8讲)
04 | 函数与字典:如何实现多次替换
05 | 图像处理库:如何实现长图拼接?
06 | jieba分词:如何基于感情色彩进行单词数量统计?
07|快速读写文件:如何实现跨文件的字数统计?
08|正则表达式:如何提高搜索内容的精确度?
09|扩展搜索:如何快速找到想要的文件?
10|按指定顺序给词语排序,提高查找效率
11 |通过程序并行计算,避免CPU资源浪费
“控制”模块:增强办公软件及周边软硬件的交互能力 (4讲)
12|文本处理函数:三招解决数据对齐问题
13|Excel插件:如何扩展Excel的基本功能?
14|VBA脚本编程:如何扩展Excel,实现文件的批量打印?
15|PowerShell脚本:如何实现文件批量处理的自动化?
“存储”模块:和文件相关的常用操作 (4讲)
16|循环与文件目录管理:如何实现文件的批量重命名?
17|不同操作系统下,如何通过网络同步文件?
18|http库:如何批量下载在线内容,解放鼠标(上)?
19|http库:如何批量下载在线内容,解放鼠标(下)?
Python自动化办公实战课
15
15
1.0x
00:00/00:00
登录|注册

18|http库:如何批量下载在线内容,解放鼠标(上)?

尹会生 2021-03-23
你好,我是尹会生。
我在前段时间遇到了下载大量图片的需求。具体来说,是在我训练 AI 识别猫时,必须要在电脑中存储大量猫的图片。但搜索到的图片都在网页中,我就需要先把它们一个个手动下载下来,再保存,然后才能进行后续的工作。
而且,随着我对 AI 训练工作的日益增多,这类需求会越来越丰富,我不仅要下载猫的图片,还要下载大量其他各种动物的图片。相信类似这种批量下载网页中的图片的需求,你在工作中会经常遇到。而这类需求,刚好能够使用 Python 的“requests-html”库实现批量下载,提高我们的工作效率。
因此呢,这节课我就以搜索到的猫的图片为例,给你讲解一下,我是怎么来批量下载图片的。

批量下载图片的准备工作

我把实现图片自动化批量下载的过程,拆分成四段难度逐渐递增的代码。这四段代码分别实现的是以下四个功能:
访问 HTTP 服务器,得到搜索结果的整个网页;
在访问服务器之后下载一张图片;
找到多张图片的相似地址;
提取相似地址,下载多张图片。
前两个功能,是批量下载图片的准备工作和前提。掌握了这两个功能,那么批量下载图片实现起来就容易多了。所以接下来,我们先来学习这两项准备工作。

访问 HTTP 服务端的资源

我们从难度最低的一段代码开始,怎么通过访问 HTTP 服务器,从而得到猫的搜索结果的整个网页。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《Python自动化办公实战课》,如需阅读全部文章,
请订阅文章所属专栏
立即订阅
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
返回
顶部