32|豆包飞速发展,7个月tokens使用量增长33倍
褚杏娟

你好,这里是极客头条。
在近日举办的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,不仅在数学、物理、图表、代码等各方面加强推理能力,而且千 tokens 输入价格仅为 3 厘,一元就可处理 284 张 720P 的图片,比行业价格便宜 85%。
此外,会上还有一系列模型产品的发布或更新。今天我们就来看看豆包的大模型产品有哪些新动态。
以下是正文:
👇👇👇
豆包视觉理解模型发布
研究显示,人类接受的信息超过 80% 来自视觉。视觉理解将极大地拓展大模型的能力边界,同时也会降低人们与大模型交互的门槛,为大模型解锁更丰富的应用场景。
据火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可以根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。
00:00 / 00:00
1.0x
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
00:00 / 00:00
1.0x
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
此前,豆包视觉理解模型已经接入豆包 App 和 PC 端产品。豆包战略研究负责人周昊表示:“豆包一直在努力,让用户的输入更快更方便”。为此,豆包产品非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。
豆包 3D 生成模型首次亮相
会上,豆包 3D 生成模型也首次亮相。豆包 3D 模型采用 3D-DiT 等算法技术生成高质量的 3D 模型。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. 豆包发布了视觉理解模型,具备出色的理解和推理能力,价格便宜85%,并已接入豆包App和PC端产品。 2. 豆包3D生成模型首次亮相,采用3D-DiT等算法技术生成高质量的3D模型,与veOmniverse结合使用,加速虚拟与现实的深度融合。 3. 豆包多款大模型产品迎来重要更新,包括通用模型pro、音乐模型、文生图模型等,将推出具备更长视频生成能力的豆包视频生成模型1.5版,以及豆包端到端实时语音模型。 4. 豆包日均tokens使用量7个月增长33倍,已与八成主流汽车品牌合作,覆盖终端设备约3亿台,得到众多企业客户青睐。 5. 火山引擎升级了火山方舟、扣子和HiAgent三款平台产品,推出新一代计算、网络、存储和安全产品,以支持大模型时代的云计算变革。 6. 火山引擎提出了AI云原生的理念,推出了新一代计算、网络、存储和安全产品,以帮助企业做好AI创新,驶向更美好的未来。
该试读文章来自《极客头条》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论