10｜体验蒸馏：如何蒸馏一个自己的DeepSeek-R1大模型

邢云阳

你好，我是邢云阳。
上节课，我带领你借助开源大模型微调工具  LLama-Factory 对 DeepSeek-R1-Distill-Qwen-7B 进行了微调，实现了新闻分类器的效果。通过这样一个挺有意思的小案例，想必你也感受到了微调的魅力。这节课我们就把目光投向另一个大模型里常用的技术——蒸馏。
什么是蒸馏那在春节前后呢，另一个大模型术语——蒸馏也是火起来了，不管知不知道啥叫蒸馏，反正都听说过。我在课程的第一讲曾用一个《射雕英雄传》的例子简单讲解过啥叫微调，今天我们就更加简单粗暴地讲解一下。
其实蒸馏呢，本质上也是微调的一种类型。传统微调是为了让大模型获取一些私域知识，比如股票、医疗等等，这是让大模型的知识面增加了，但没有改变大模型的能力。而蒸馏不一样，蒸馏不光教知识，还要教能力。所谓授之以鱼，不如授之以渔，蒸馏就是要让被训练的模型能够学会教师模型的能力。
我们知道传统的一些快速响应模型，比如 qwen2.5、llama3 等等模型是不带思维链的。但 DeepSeek-R1 模型带有思维链，而且思考能力很强。因此对 DeepSeek-R1 蒸馏的意义就是要让 qwen2.5 等模型也学会思维链，就是这么简单。
那接下来，我们看一下蒸馏一个自己的小模型，应该怎么做。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. 蒸馏是一种微调的类型，旨在让被训练的模型学会教师模型的能力，而不仅仅是知识。 2. 蒸馏的流程包括准备数据集，将数据喂给大模型以生成教学数据，然后使用监督微调让小模型学会大模型的输出模式。 3. 生成教学数据需要根据实际业务情况编写合适的提示词，包括描述需求、规定分类种类、示例以及向大模型提问和反馈答案的代码。 4. 教学数据的生成需要懂得业务，写出逼真、符合大模型口吻的示例，以获得良好的效果.

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《DeepSeek 应用开发实战》，新⼈⾸单¥59

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论