DeepSeek 应用开发实战
邢云阳
联通云 AI 与容器技术专家
16 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已更新 2 讲/共 34 讲
前置课程:快速入门 DeepSeek 以及 AI 开发必备技术 (1讲)
DeepSeek 应用开发实战
15
15
1.0x
00:00/00:00
登录|注册

01|DeepSeek“民用级”程序员使用指北

你好,我是邢云阳。
飞雪连天射白鹿,笑书神侠倚碧鸳。金庸老先生的著作人物众多,武学精妙绝伦,剧情跌宕起伏,非常吸引人。我在上大学时,曾经两天时间就读完了《射雕英雄传》。
恰逢最近 DeepSeek 模型爆火,“模型蒸馏”这个专业名词也频繁出现在大众视野,所以在前置课程里面,我想先借着《射雕英雄传》里的人物,来聊聊“模型蒸馏”。不过你不用担心它过于深奥,作为应用开发者,我们只要知道它大致的原理就足够了。
然后呢,我想和你聊聊普通程序员怎么迎接 DeepSeek 的东风,可以用它帮我们做那些事儿。还会分享一下课程学习方法和建议,让你轻装上阵,为后续课程的学习打好基础。

蒸馏是什么?

在《射雕英雄传》中,洪七公是江湖上人人敬仰的北丐,武功高强,见识广博,内力深厚,就像大模型,经过了海量数据的训练,拥有强大的知识储备和计算能力。然而,大模型的训练和部署成本极高,就像洪七公的武功,不是人人都能轻易学会的。
但洪七公总要收徒传艺,将丐帮武学传承下去。因此他需要将武功用“浓缩”的方式交给徒弟,在保证一定精度的同时,大幅降低对于内力(GPU)的要求,例如,他将打狗棒法传给了黄蓉,将降龙十八掌传给了郭靖等等,这便是模型蒸馏技术。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 模型蒸馏是一种将大型模型的知识“浓缩”传授给小型模型的技术,以降低模型的部署和推理成本,提高小型模型的应用效率。 2. DeepSeek是一个人工智能模型,可用于聊天对话、写文章、翻译、客服问答等,同时有不同版本适用于不同场景,如逻辑推理、科研分析、金融策略生成等。 3. DeepSeek模型的部署和使用需要付费调用其对话等功能的API,而由于其突然爆火,官方服务器算力不够,导致暂停充值,这也为云厂商带来商机。 4. 个人创业者可以利用AI技术做模型微调、精调,开发行业应用,如AI医疗、AI炒股,以及开发工作流应用等。 5. 通过AI技术的加持,个人创业者可以更好地抓住机遇,提高竞争优势。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《DeepSeek 应用开发实战》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部