成为 AGI 产品经理
姬阁阁 (产品二姐)
前 IBM、京东产品经理, 公众号“产品二姐”主理人
1166 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已更新 21 讲/共 24 讲
开篇词 (1讲)
成为 AGI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

15|算力(一):AI时代的“电费”怎么算?

你好,我是产品二姐。
对于产品经理来说,每一个产品都要去评估它的 ROI(投入产出比), 今天我们聊聊如何计算“投入”这一项中的“算力成本”。
算力成本这件事看起来很复杂,但如果我们从两个维度来分析,并且用“发电站”来类比就会非常清晰,容易理解。
第一个维度是大语言模型的部署方式,有三种方式:直接调用大模型接口、私有化部署在云端和私有化部署在本地硬件。
第二个维度是成本消耗方式,有推理和模型微调两种。推理就是直接使用模型的标准输出,训练就是需要对模型本身进行一定的改造,类比于使用电时一般电器使用标准电压即可,但有些特殊设备,可能需要加个变压器(比如 Lora 中的增量参数矩阵),或者是改变发电机本身来输出非标准电压。前者是每个 AI 应用都一定有的成本,后者是可选项,必要的时候才会启动。
一般来说,部署方式对成本的影响更大,因此,我会按照部署方式划分的三种情况来讲解,每种部署方式中再分别讲述它对应的推理和模型微调成本。
好,我们来详细讲讲。
直接调用大模型接口
如果你的部署方式是直接调用模型厂商接口,那么模型厂商相当于发电站。这里发的电就是 “Token”,而你负责缴纳电费,也就是缴纳 Token 消耗费用。
通常情况下,你只需要通用 220 伏的电就好,这里相当于成本消耗方式就是“推理”;但有的时候,你需要用 380 伏或者其他电压供电,这时你需要发电站做一些调整,因此要支付更高的 Token 费用,这就是以“模型微调”方式消耗的成本。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 算力成本的两个维度:部署方式和成本消耗方式,类比于发电站的运作方式,清晰易懂。 2. 三种部署方式对应的成本消耗方式:直接调用大模型接口、私有化部署在云端和私有化部署在本地硬件。 3. 计算成本的公式:推理成本 = 模型推理接口调用的Token单价 * Token数;训练成本(微调成本)= 模型微调接口Token单价 * 训练数据的Token数。 4. 不同模型厂商的Token价格差异,以及输入、输出Token单价的不同,以及BatchAPI的价格和使用场景。 5. 缓存提示词的作用和效果,以及如何利用BatchAPI来降低成本。 6. Token数的计算和重要性。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AGI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部
文章页面操作
MAC
windows
作用
esc
esc
退出沉浸式阅读
shift + f
f11
进入/退出沉浸式
command + ⬆️
home
滚动到页面顶部
command + ⬇️
end
滚动到页面底部
⬅️ (仅针对订阅)
⬅️ (仅针对订阅)
上一篇
➡️ (仅针对订阅)
➡️ (仅针对订阅)
下一篇
command + j
page up
向下滚动一屏
command + k
page down
向上滚动一屏
p
p
音频播放/暂停
j
j
向下滚动一点
k
k
向上滚动一点
空格
空格
向下滚动一屏
播放器操作
MAC
windows
作用
esc
esc
退出全屏
⬅️
⬅️
快退
➡️
➡️
快进
空格
空格
视频播放/暂停(视频全屏时生效)