16｜算力（二）：私有化部署大模型到底有多贵？

产品二姐

你好，我是产品二姐。
上节课，我们介绍了 AI 产品中直接调用模型厂商接口的成本计算方法，这也是 AI 应用最容易起步的方法。但随着 AI 逐步深入各种场景，尤其是企业场景里，这种直接调用的方法并不友好。
比如企业希望大模型能对内部的业务数据进行分析、总结，但考虑到数据安全，企业无法接受将业务数据直接发给模型厂商，比如我们在第 12 节就遇到了类似的诉求。
而私有化部署开源模型能保障所有和模型交互的数据不外泄，企业可以更自由地把大语言模型与企业数据库、业务接口集成在自己的 AI 产品中。比如用户可以直接问“这个月的工厂产量有多少”，AI 应用就可以直接读取企业数据库，拿到这个数据。同时，一些企业在 AI 建设初期也希望避免大额硬件投资。
于是，将开源模型私有化部署在云端成为另一种选择。
这节课，我就来介绍一下这种部署方式的算力成本计算方法。
同样需要提醒大家：本文所有价格示例均为作者撰写课程内容时的价格，通用模型 API Token 价格、私有云厂商的资源租赁价格和硬件价格变化幅度都会比较大，请大家参考时价计算。
情况二：使用云端私有化部署模型的成本计算我们继续用发电站做类比：不同的发电机体量，对厂房的要求也不一样；发电机越大，对厂房要求也更高；并且如果大到需要多个厂房的时候，厂房之间的数据通讯会降低单个厂房的使用率。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. 企业希望使用大模型对内部业务数据进行分析，但担心数据安全问题，因此无法将业务数据直接发送给模型厂商。 2. 私有化部署开源模型可以保障数据安全，使企业能够自由地将大语言模型与企业数据库、业务接口集成在自己的AI产品中。 3. 在云端私有化部署模型时，需要根据模型参数量计算所需显存资源，并选择相应的GPU卡型号。 4. GPU芯片的核心参数包括显存、计算速度、GPU带宽，不同精度的要求会影响计算速度。 5. 模型部署所需的显存空间主要用于加载模型参数，需要根据模型参数量计算选择所需的GPU卡型号。 6. 计算模型推理能力成本时，需要考虑模型参数量、GPU卡型号和租赁单价。 7. 模型微调成本是按次数计算的，包括计算所需GPU显存、微调所需计算时长和云资源租赁价格。 8. 自采硬件私有化部署的成本计算步骤类似于云端私有化部署，需要根据模型大小计算显存需求，并选择对应的GPU型号。 9. 在实际预估成本时，需要参考方法而不是直接使用网络公开价格。 10. 在进行算力成本预算报告时，需要分别计算使用云端资源私有化部署和自采硬件私有化部署的推理成本和微调成本。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《成为 AGI 产品经理》，新⼈⾸单¥59

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论