你将获得
"1. 深入理解 Hugging Face Transformers 库核心功能,熟练使用 Pipelines、Tokenizer、Models 等模块快速实践大模型应用。
2. 掌握大模型开发环境搭建技巧,能独立配置 GPU 开发环境及使用 Google Colab 测试环境。
3. 精通 Hugging Face Datasets 库的数据预处理方法,包括填充、截断及 Datasets.map 方法的实战应用。
4. 学会使用 Trainer 类与 TrainingArguments 配置模型训练,实战完成 BERT 等模型的文本分类、QA 任务训练。"
课程介绍
“本课程聚焦大模型开发中的核心工具与实战技能,围绕 Hugging Face 生态展开系统教学。第一章从 Transformers 库快速入门切入,解析 Transformers 库的核心定位与功能模块,手把手教学使用 Pipelines 实现大模型快速实践、用 Tokenizer 完成文本编解码、通过 Models 加载和保存模型。同时详细讲解大模型开发环境搭建,包括 GPU 开发环境配置与 Google Colab 测试环境使用,并通过实战演练帮助学员熟悉 Transformers 工具库的核心操作。
第二章聚焦 Transformers 模型训练实战,首先介绍 Hugging Face Datasets 库的基础功能,重点讲解数据预处理的关键策略(填充与截断)及 Datasets.map 方法在数据集处理中的应用。接着深入模型训练基础,解析模型训练基类 Trainer 的核心逻辑、训练参数与超参数配置工具 TrainingArguments,以及模型训练评估库 Hugging Face Evaluate 的使用方法。最后通过实战案例巩固所学:基于 bert-base-cased 模型完成文本分类任务训练,基于 distilbert-base-uncased 模型实现 QA 任务训练,让学员全程参与从数据处理到模型训练的完整流程,掌握大模型开发的核心技能。”
课程目录
" 第一章:大模型开发工具库 Hugging Face Transformers
- Hugging Face Transformers 快速入门
- Transformers 库是什么?
- Transformers 核心功能模块
- 使用 Pipelines 快速实践大模型
- 使用 Tokenizer 编解码文本
- 使用 Models 加载和保存模型
- 大模型开发环境搭建
- 搭建你的 GPU 开发环境
- Google Colab 测试环境
- 实战 Hugging Face Transformers 工具库
第二章:实战 Transformers 模型训练
- 数据集处理库 Hugging Face Datasets
- Hugging Face Datasets 库简介
- 数据预处理策略:填充与截断
- 使用 Datasets.map 方法处理数据集
- Transformers 模型训练入门
- 模型训练基类 Trainer
- 训练参数与超参数配置 TrainingArguments
- 模型训练评估库 Hugging Face Evaluate
- 实战使用 Transformers 训练 BERT 模型
- bert-base-cased 模型(文本分类任务)
- distilbert-base-uncased 模型(QA 任务)"











