26 | PyTorch简介：如何构造Dataset和DataLoader？

当前播放: 26 | PyTorch简介：如何构造Dataset和DataLoader？









00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.5x



网页全屏



全屏

00:00

付费课程，可试看

课程目录

第一章：AI及NLP基础 (15讲)



01 | 课程介绍

免费

02 | 内容综述

免费

03 | AI概览：宣传片外的人工智能

免费

04 | AI项目流程：从实验到落地

免费

05 | NLP领域简介：NLP基本任务及研究方向

免费

06 | NLP应用：智能问答系统

07 | NLP应用：文本校对系统

08 | NLP的学习方法：如何在AI爆炸时代快速上手学习？

09 | 深度学习框架简介：如何选择合适的深度学习框架？

10 | 深度学习与硬件：CPU

11 | 深度学习与硬件：GPU

12 | 深度学习与硬件：TPU

13 | AI项目部署：基本原则

14 | AI项目部署：框架选择

15 | AI项目部署：微服务简介

第二章：深度学习简介和NLP试水 (14讲)



16 | 统计学基础：随机性是如何改变数据拟合的本质的？

17 | 神经网络基础：神经网络还是复合函数

18 | 神经网络基础：训练神经网络

19 | 神经网络基础：神经网络的基础构成

20 | Embedding简介：为什么Embedding更适合编码文本特征？

21 | RNN简介：马尔可夫过程和隐马尔可夫过程

22 | RNN简介：RNN和LSTM

23 | CNN：卷积神经网络是什么？

24 | 环境部署：如何构建简单的深度学习环境？

25 | PyTorch简介：Tensor和相关运算

26 | PyTorch简介：如何构造Dataset和DataLoader？

27 | PyTorch简介：如何构造神经网络？

28 | 文本分类实践：如何进行简单的文本分类？

29 | 文本分类实践的评价：如何提升进一步的分类效果？

第三章：表格化数据挖掘 (8讲)



30 | 经典的数据挖掘方法：数据驱动型开发早期的努力

31 | 表格化数据挖掘基本流程：看看现在的数据挖掘都是怎么做的？

32 | Pandas 简介：如何使用Pandas对数据进行处理？

33 | Matplotlib 简介：如何进行简单的可视化分析？

34 | 半自动特征构建方法：Target Mean Encoding

35 | 半自动特征构建方法：Categorical Encoder

36 | 半自动特征构建方法：连续变量的离散化

37 | 半自动特征构建方法：Entity Embedding

26 | PyTorch简介：如何构造Dataset和DataLoader？

26 | PyTorch简介：如何构造Dataset和DataLoader？

王然

众微科技AI Lab技术负责人、阿姆斯特丹大学数学和计量经济学双硕士

120讲每周一/四更新1829

订阅¥129







本节摘要

课件和 Demo 地址
https://github.com/geektime-geekbang/NLP

登录后留言

精选留言(2)

王柯

这一课给我的启发有两点：
1.“天下没有免费的午餐”
2.大数据的读写方式对效率的优化很重要

2020-03-22




Ayaya

老师, 你在 6min20s 讲解 Dataset 的时候提到
“在每次 iteration 的时候, 再去重新对它进行分词, 然后对它做对应的如 token 一样的操作, 比如我运行成0, 然后你又运行成1这样的操作”, 这里有点不太能理解.
这里“重新”是指每次 iteration 都采用不同的分词和 token 方法吗? 还是说在原始数据上加入额外的处理? 因为我接触 NLP 时间较短, 不知道这样的做法有哪些实用场景, 所以就希望老师能举一个小例子讲解一下.

作者回复: 这里字幕有一些问题。但是实际意思就是说我为了尽可能节省显存和内存，我直接通过文件IO的方式做循环。这样的确节省了存储但运算效率就很糟糕了

2020-03-21





收起评论

看过的人还看

TensorFlow快速入门与实战

彭靖田 Google Developers Expert，《深入理解TensorFlow》作者

67讲 | 7498 人已学习

拼团 ¥99 ~~原价 ¥129~~

后端存储实战课

李玥京东零售计算存储平台部资深架构师

26讲 | 3275 人已学习

拼团 ¥79 ~~原价 ¥99~~

深入浅出云计算

何恺铎前国双技术总经理

18讲 | 1468 人已学习

¥68

数据结构与算法之美

王争前Google工程师

79讲 | 76933 人已学习

拼团 ¥79 ~~原价 ¥99~~