DeepSeek 应用开发实战
云阳
某大厂 AI 与容器技术专家
3688 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已更新 14 讲/共 34 讲
DeepSeek 应用开发实战
15
15
1.0x
00:00/00:00
登录|注册

10|体验蒸馏:如何蒸馏一个自己的DeepSeek-R1大模型

你好,我是邢云阳。
上节课,我带领你借助开源大模型微调工具  LLama-Factory 对 DeepSeek-R1-Distill-Qwen-7B 进行了微调,实现了新闻分类器的效果。通过这样一个挺有意思的小案例,想必你也感受到了微调的魅力。这节课我们就把目光投向另一个大模型里常用的技术——蒸馏。

什么是蒸馏

那在春节前后呢,另一个大模型术语——蒸馏也是火起来了,不管知不知道啥叫蒸馏,反正都听说过。我在课程的第一讲曾用一个《射雕英雄传》的例子简单讲解过啥叫微调,今天我们就更加简单粗暴地讲解一下。
其实蒸馏呢,本质上也是微调的一种类型。传统微调是为了让大模型获取一些私域知识,比如股票、医疗等等,这是让大模型的知识面增加了,但没有改变大模型的能力。而蒸馏不一样,蒸馏不光教知识,还要教能力。所谓授之以鱼,不如授之以渔,蒸馏就是要让被训练的模型能够学会教师模型的能力。
我们知道传统的一些快速响应模型,比如 qwen2.5、llama3 等等模型是不带思维链的。但 DeepSeek-R1 模型带有思维链,而且思考能力很强。因此对 DeepSeek-R1 蒸馏的意义就是要让 qwen2.5 等模型也学会思维链,就是这么简单。
那接下来,我们看一下蒸馏一个自己的小模型,应该怎么做。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 蒸馏是一种微调的类型,旨在让被训练的模型学会教师模型的能力,而不仅仅是知识。 2. 蒸馏的流程包括准备数据集,将数据喂给大模型以生成教学数据,然后使用监督微调让小模型学会大模型的输出模式。 3. 生成教学数据需要根据实际业务情况编写合适的提示词,包括描述需求、规定分类种类、示例以及向大模型提问和反馈答案的代码。 4. 教学数据的生成需要懂得业务,写出逼真、符合大模型口吻的示例,以获得良好的效果.

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《DeepSeek 应用开发实战》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部
文章页面操作
MAC
windows
作用
esc
esc
退出沉浸式阅读
shift + f
f11
进入/退出沉浸式
command + ⬆️
home
滚动到页面顶部
command + ⬇️
end
滚动到页面底部
⬅️ (仅针对订阅)
⬅️ (仅针对订阅)
上一篇
➡️ (仅针对订阅)
➡️ (仅针对订阅)
下一篇
command + j
page up
向下滚动一屏
command + k
page down
向上滚动一屏
p
p
音频播放/暂停
j
j
向下滚动一点
k
k
向上滚动一点
空格
空格
向下滚动一屏
播放器操作
MAC
windows
作用
esc
esc
退出全屏
⬅️
⬅️
快退
➡️
➡️
快进
空格
空格
视频播放/暂停(视频全屏时生效)