零基础学 Python(2023 版)
尹会生
太乙人工智能技术合伙人 & 项目总监
60050 人已学习
新⼈⾸单¥68
课程目录
已完结/共 124 讲
结束语 & 结课测试 (2讲)
零基础学 Python(2023 版)
登录|注册
留言
7
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 93|再回首:“数据分析”单元小结
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
课程介绍:这次我们都做了哪些升级?
内容综述:明确学习目的
01|如何配置 Python 开发环境?
02 | 常用 IDE:如何提高开发效率?
03 | 如何站在官方文档的肩膀上自己“造轮子”?
04 | 怎样运行你的第一行代码?
05 | 怎样使用 Gitee 管理你的代码?
06 | 学习编程有问题?去这里找答案!
07|跨越门槛:Python 开发环境总结及实现原理
08 | 修炼基本功:浅析输入输出
09 | 变量:如何让计算机临时存储数据?
10|字符串(上):Python 是如何处理单词的?
11|字符串(下):Python 是如何处理单词的?
12|存储数字应该采用哪种数据类型?
13|何时使用数,何时使用字符串?
14|注释:如何写程序的说明书?
15|小试牛刀:如何制作简单计算器?
16|变量命名规范:如何编写优雅的程序?
17|告别新手村:Python 编程基础知识
18|内置数据类型包括哪几种?
19|列表如何处理同类数据?
20|常见常新:列表的常见操作
21|元组:如何处理一次性数据?
22|常见常新:集合的常见操作
23|字典:如何处理映射类型的数据?
24|常见常新:字典的常见操作(上)
25|常见常新:字典的常见操作(下)
26|小试牛刀:如何利用类型转换实现手机通讯录?(上)
27|小试牛刀:如何利用类型转换实现手机通讯录?(下)
28|常见的内置数据类型都何时使用?
29|避坑指南:内置数据类型的常见错误
30|内置数据类型参考:如何使用官方文档与帮助?
31|再回首:“内置数据类型”单元小结
32|if 语句:数据流程出现分支时,怎样编写程序?
33|match 语句:如何通过 match 关键字来处理程序的分支逻辑?
34|while 循环:需要多次重复执行某段程序时,怎么做?
35|for 循环:如何遍历一个对象里的所有元素?
36|语句嵌套:如何处理多重循环的问题?
37|小试牛刀:如何设计一个飞机大战的程序?
38|避坑指南:判断和循环中的常见错误
39|再回首:“判断循环”单元小结
40|输入:如何接收用户通过键盘输入的数据?
41|格式化输出:如何将执行结果通过屏幕输出?
42|F-strings:如何通过定义好的格式进行输出?
43 | 常见常新:文件的打开
44|文件编码:如何解决不同操作系统的文件乱码问题?
45|常见常新:文件的读写
46|常见常新:文件的关闭
47|小试牛刀:如何使用 Python 合并多个文件?
48|再回首:“输入输出与文件操作”单元小结
49|函数的定义:如何优雅地反复引用同一段代码?
50|函数的参数:怎样实现函数与外部数据通信?
51|函数的参数:当函数操作对象不固定时怎么处理?
52|函数的返回值:如何得到函数的执行结果?
53|小试牛刀:如何利用函数实现电商购物车功能?
54|避坑指南:列表作为参数传递出错了怎么办?
55|高阶函数:函数对象与函数调用的用法区别
56|装饰器:函数嵌套的定义与调用的区别
57|再回首:“函数”单元小结
58|编程思想不同会导致怎样的代码差异?
59|类与实例:如何使用面向对象的思想编写程序?
60|类的继承:如何解决代码重用的问题?
61|类的装饰器:如何改变类方法的功能?
62|小试牛刀:如何开发自动咖啡机?
63|避坑指南:类的常见错误
64|init 方法:如何为对象传递参数?
65|再回首:“类”单元小结
66 | 模块的导入:如何使用其他人编写好的代码功能?
67 | 标准库:Python 默认提供的便捷功能有哪些?
68 | 自定义模块:如何编写一个完整功能?
69 | 第三方模块的使用:如何使用其他人编写的代码?
70 | 小试牛刀:如何使用 Python 为函数求导?
71|再回首:“模块与标准库”单元小结
72|初识异常:异常的产生与分类
73|异常捕获:出现异常时,如何利用程序进行处理?
74|自定义异常捕获:如何定义业务异常?
75|避坑指南:编写捕获异常程序时经常出现的问题
76|再回首:“异常处理”单元小结
77|扩展数据类型:怎样使用更复杂的数据类型?
78|魔术方法:怎样通过类构造自己需要的数据类型?
79|怎样将 Python 和 C++ 结合起来混合编程?
80|怎样将已有算法改造成符合项目的特定算法?
81|设计模式:怎样合理组合多个函数和类?
82|Redis 数据库:怎样使用 NoSQL 数据库?
83|关系型数据库:怎样使用关系型数据库?
84|计算资源充足时,如何通过并行设计提高效率?
85|多进程间如何通信?
86|再回首:“高级数据类型与算法”单元小结
87|理论盘点:数据分析的流程及对应的 Python 库
88|理论盘点:数据采集的方法与 HTTP 协议
89|理论盘点:任务的并行执行原理
90|理论盘点:非规范化数据处理的基础与正则表达式
91|如何获取网页上的数据并存储到文件?
92|小试牛刀:如何将数据进行图形化展示?
93|再回首:“数据分析”单元小结
94|理论盘点:文件类型与对应的 Python 函数库
95|如何批量读取 Excel 文件?
96|如何实现数据的批量格式转换?
97|如何扩展数据类型?
98|再回首:“办公自动化”单元小结
99|理论盘点:Web 客户端与服务端
100|理论盘点:MVC 模型是什么?
101|如何使用Django搭建简单的Web服务器?
102|如何使用Django-admin实现文章上传?
103|如何使用Django实现文章发布?
104|再回首:“Web开发”单元小结
105|理论盘点:人脸识别的一般步骤
106|理论盘点:人脸识别常用的 Python 库有哪些?
107|怎样通过 OpenCV 采集视频信号?
108|如何训练人脸模型?
109|怎样设计人脸识别系统?
110|再回首:“计算机视觉”单元小结
111|聚焦异同:物联网与互联网有啥不一样?
112|理论盘点:基础但不简单的 TCP 协议
113|理论盘点:物模型与模组
114|如何为 ESP32 安装 MicroPython?
115|怎样通过 MQTT 协议构建消息队列?
116|小试牛刀:在 OLED 屏幕和手机远程同时显示室内温度
117|再回首:“物联网”单元小结
118|结束语:人生苦短,我用Pyhon
结课测试|来赴一场满分之约吧!
直播加餐|与AI共同编程,用ChatGPT学Python
直播加餐|用OpenAI API理解Python数据类型
直播加餐|掌握Gradio框架:为 AI Agent 程序定制界面
本节摘要

你好,我是尹会生。

这一章,我为你展示了如何使用 Python,实现数据分析工作中的数据采集、清洗、存储、分析,以及展示各个环节的工作。从视频中我们知道,Python 能够实现数据分析工作中的绝大多数功能,所以 Python 也成为很多数据分析师手中的利器,甚至 Python 还可以通过第三方库支持很多现成的数据分析算法,让你开箱即用。

在数据分析过程中,我们除了使用 Python 的基本功能外,很多时候还要使用 Python 的第三方库来实现更加强大的功能,那么这一讲,我来为你盘点一下功能强大又使用便利的第三方库,让你在数据分析工作中能够事半功倍。

首先,我们将数据分析中常用的库按照数据采集、数据清洗、数据分析分成 3 个部分,下面我们依次介绍一下这 3 个部分。我们先来看数据采集常用的 Python 库。

数据采集

利用 Python 做数据采集工作时,我们用得最多的是 Requests、Selenium、Charles 三个库。其中前两个库用来采集 PC 端 HTTP 接口的数据,最后一个用来采集手机端 App 数据。我们一个一个来详细了解它们。

Requests 库号称是“对人类友好的 HTTP 库”,这也是即使 Python 标准库中已经有了功能非常强大的 HTTP 库,我还会再推荐它的原因。那么 Requests 库的友好体现在哪里呢?

登录 后留言

全部留言(7)

  • 最新
  • 精选
刘永超
尹老师的课提纲挈领,精简通透,娓娓道来,实战代码丰富,从中感受专家的技术魅力,感谢尹老师!感谢极客时间,让专家就在身边。

作者回复: 谢谢,一起加油

2023-01-24
Geek_631607
在 Python 中,你可以使用各种库来抓取和保存非文字类数据。以下是一些基本的步骤和代码示例: 1. **获取数据的地址**:通常,非文字类数据(如图片或声音文件)在网页上以链接的形式存在。你可以使用 `requests` 库来获取网页的内容,然后使用 `BeautifulSoup` 库来解析网页并提取出数据的链接。以下是一个简单的代码示例: ```python from bs4 import BeautifulSoup import requests # 获取网页内容 url = 'https://example.com' response = requests.get(url) # 解析网页 soup = BeautifulSoup(response.text, 'html.parser') # 提取图片链接 img_urls = [img['src'] for img in soup.find_all('img')] # 提取声音文件链接 audio_urls = [audio['src'] for audio in soup.find_all('audio')] ``` 2. **保存数据到本地**:一旦你获取到了数据的链接,你就可以使用 `requests` 库来下载数据,并将其保存到本地。以下是一个简单的代码示例: ```python import os # 下载并保存图片 for img_url in img_urls: img_data = requests.get(img_url).content with open(os.path.join('path_to_save_images', 'image.jpg'), 'wb') as handler: handler.write(img_data) # 下载并保存声音文件 for audio_url in audio_urls: audio_data = requests.get(audio_url).content with open(os.path.join('path_to_save_audios', 'audio.mp3'), 'wb') as handler: handler.write(audio_data) ``` 以上就是使用 Python 抓取和保存非文字类数据的基本方法。希望这个答案对你有所帮助!
2023-12-11
760418
# 中文乱码 plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False # 绘制折线图 plt.plot(x, y1, label=" 北京 ") plt.plot(x, y2, label=" 上海 ") plt.legend(loc="upper left") plt.title(" 北京与上海近 7 天温度情况 ") plt.ylabel(" 温度 ") plt.xlabel(" 日期 ") plt.show()
2023-12-07
760418
# 中文乱码 plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False # 绘制折线图 plt.plot(x, y1, label=" 北京 ") plt.plot(x, y2, label=" 上海 ") plt.legend(loc="upper left") plt.title(" 北京与上海近 7 天温度情况 ") plt.ylabel(" 温度 ") plt.xlabel(" 日期 ") plt.show()
2023-12-06
760418
谢谢
2023-12-06
MarkG
获取到图片和声音的地址后,通过requests库读取网络文件,确保大文件逐块下载,然后以二进制写入文件
2023-11-01
Matthew
如果要抓取的数据是图片、声音等非文字类数据,可以将这些非文字类数据下载到本机,通过文件形式进行存储。同时,将文件的绝对存储路径作为一个索引信息,存储在数据库中。
2023-01-27
收起评论