大模型开发工具库
精通 Hugging Face 工具链,从零上手大模型训练与开发
彭靖田  LangChain 开发者,谷歌开发者专家
视频课
已完结·共 10 讲
|
1 人已学
|
收藏
立即购买
59

你将获得

"1. 深入理解 Hugging Face Transformers 库核心功能,熟练使用 Pipelines、Tokenizer、Models 等模块快速实践大模型应用。​

2. 掌握大模型开发环境搭建技巧,能独立配置 GPU 开发环境及使用 Google Colab 测试环境。​
3. 精通 Hugging Face Datasets 库的数据预处理方法,包括填充、截断及 Datasets.map 方法的实战应用。​
4. 学会使用 Trainer 类与 TrainingArguments 配置模型训练,实战完成 BERT 等模型的文本分类、QA 任务训练。"

课程介绍

“本课程聚焦大模型开发中的核心工具与实战技能,围绕 Hugging Face 生态展开系统教学。第一章从 Transformers 库快速入门切入,解析 Transformers 库的核心定位与功能模块,手把手教学使用 Pipelines 实现大模型快速实践、用 Tokenizer 完成文本编解码、通过 Models 加载和保存模型。同时详细讲解大模型开发环境搭建,包括 GPU 开发环境配置与 Google Colab 测试环境使用,并通过实战演练帮助学员熟悉 Transformers 工具库的核心操作。​
第二章聚焦 Transformers 模型训练实战,首先介绍 Hugging Face Datasets 库的基础功能,重点讲解数据预处理的关键策略(填充与截断)及 Datasets.map 方法在数据集处理中的应用。接着深入模型训练基础,解析模型训练基类 Trainer 的核心逻辑、训练参数与超参数配置工具 TrainingArguments,以及模型训练评估库 Hugging Face Evaluate 的使用方法。最后通过实战案例巩固所学:基于 bert-base-cased 模型完成文本分类任务训练,基于 distilbert-base-uncased 模型实现 QA 任务训练,让学员全程参与从数据处理到模型训练的完整流程,掌握大模型开发的核心技能。”

课程目录

" 第一章:大模型开发工具库 Hugging Face Transformers

  1. Hugging Face Transformers 快速入门
  • Transformers 库是什么?
  • Transformers 核心功能模块
  • 使用 Pipelines 快速实践大模型
  • 使用 Tokenizer 编解码文本
  • 使用 Models 加载和保存模型
  1. 大模型开发环境搭建
  • 搭建你的 GPU 开发环境
  • Google Colab 测试环境
  1. 实战 Hugging Face Transformers 工具库

第二章:实战 Transformers 模型训练

  1. 数据集处理库 Hugging Face Datasets
  • Hugging Face Datasets 库简介
  • 数据预处理策略:填充与截断
  • 使用 Datasets.map 方法处理数据集
  1. Transformers 模型训练入门
  • 模型训练基类 Trainer
  • 训练参数与超参数配置 TrainingArguments
  • 模型训练评估库 Hugging Face Evaluate
  1. 实战使用 Transformers 训练 BERT 模型
  • bert-base-cased 模型(文本分类任务)
  • distilbert-base-uncased 模型(QA 任务)"
查看更多

订阅须知

  1. 订阅成功后,推荐通过“极客时间”App 端、Web 端学习。
  2. 本课程为虚拟商品,交付形式为视频,一经订阅,概不退款。
  3. 订阅后分享海报,每邀一位好友订阅有现金返现。
  4. 戳此先充值再购课更划算,还有最新课表、超值赠品福利。
  5. 企业采购推荐使用“极客时间企业版”便捷安排员工学习计划,掌握团队学习仪表盘。
  6. 戳此申请学生认证,订阅课程享受原价 5 折优惠。
  7. 价格说明:划线价、订阅价为商品或服务的参考价,并非原价,该价格仅供参考。未划线价格为商品或服务的实时标价,具体成交价格根据商品或服务参加优惠活动,或使用优惠券、礼券、赠币等不同情形发生变化,最终实际成交价格以订单结算页价格为准。
讲师

彭靖田

LangChain 开发者,谷歌开发者专家

" 彭靖田,Google Developers Expert,加州大学圣迭戈分校访问学者,在美国期间从事深度学习与生物医疗技术的结合研究。毕业于浙江大学竺可桢学院,获计算机科学学士学位。 开源项目 Kubeflow 维护者,TensorFlow 贡献者,曾一度成为...查看更多
看过的人还看了
iOS 开发高手课
戴铭
前滴滴出行技术专家

47讲 | 43768 人已学习

¥59¥129
架构实战案例解析
王庆友
前 1 号店首席架构师

23讲 | 19796 人已学习

¥59¥99
编程高手必学的内存知识
海纳
华为编译器高级专家,原 Huawei JDK 团队负责人

33讲 | 21676 人已学习

¥59¥99
超级访谈:对话汤峥嵘
汤峥嵘
云柚智能创始人,前阿里 P10、淘宝主架构师

17讲 | 6495 人已学习

¥59¥99
从 0 开始学大数据
李智慧
同程艺龙交通首席架构师,前 Intel 大数据架构师,《大型网站技术架构》作者

47讲 | 73472 人已学习

¥68¥199
PyTorch 深度学习实战
方远
LINE China 数据科学家

32讲 | 12649 人已学习

¥59¥129