32｜豆包飞速发展，7个月tokens使用量增长33倍

褚杏娟

你好，这里是极客头条。
在近日举办的火山引擎 Force 大会上，字节跳动正式发布豆包视觉理解模型，不仅在数学、物理、图表、代码等各方面加强推理能力，而且千 tokens 输入价格仅为 3 厘，一元就可处理 284 张 720P 的图片，比行业价格便宜 85％。
此外，会上还有一系列模型产品的发布或更新。今天我们就来看看豆包的大模型产品有哪些新动态。
以下是正文：
👇👇👇
豆包视觉理解模型发布研究显示，人类接受的信息超过 80% 来自视觉。视觉理解将极大地拓展大模型的能力边界，同时也会降低人们与大模型交互的门槛，为大模型解锁更丰富的应用场景。
据火山引擎总裁谭待介绍，豆包视觉理解模型不仅能精准识别视觉内容，还具备出色的理解和推理能力，可以根据图像信息进行复杂的逻辑计算，完成分析图表、处理代码、解答学科问题等任务。此外，该模型有着细腻的视觉描述和创作能力。
 Sorry, your browser doesn't support embedded videos. 
00:00 / 00:00
1.0x
 3.0x 
 2.5x 
 2.0x 
 1.5x 
 1.25x 
 1.0x 
 0.75x 
 0.5x 
音量
网页全屏
全屏
00:00
 Sorry, your browser doesn't support embedded videos. 
00:00 / 00:00
1.0x
 3.0x 
 2.5x 
 2.0x 
 1.5x 
 1.25x 
 1.0x 
 0.75x 
 0.5x 
音量
网页全屏
全屏
00:00
此前，豆包视觉理解模型已经接入豆包 App 和 PC 端产品。豆包战略研究负责人周昊表示：“豆包一直在努力，让用户的输入更快更方便”。为此，豆包产品非常注重多模态的输入和打磨，包括语音、视觉等能力，这些模型都已通过火山引擎开放给企业客户。
豆包 3D 生成模型首次亮相会上，豆包 3D 生成模型也首次亮相。豆包 3D 模型采用 3D-DiT 等算法技术生成高质量的 3D 模型。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. 豆包发布了视觉理解模型，具备出色的理解和推理能力，价格便宜85％，并已接入豆包App和PC端产品。 2. 豆包3D生成模型首次亮相，采用3D-DiT等算法技术生成高质量的3D模型，与veOmniverse结合使用，加速虚拟与现实的深度融合。 3. 豆包多款大模型产品迎来重要更新，包括通用模型pro、音乐模型、文生图模型等，将推出具备更长视频生成能力的豆包视频生成模型1.5版，以及豆包端到端实时语音模型。 4. 豆包日均tokens使用量7个月增长33倍，已与八成主流汽车品牌合作，覆盖终端设备约3亿台，得到众多企业客户青睐。 5. 火山引擎升级了火山方舟、扣子和HiAgent三款平台产品，推出新一代计算、网络、存储和安全产品，以支持大模型时代的云计算变革。 6. 火山引擎提出了AI云原生的理念，推出了新一代计算、网络、存储和安全产品，以帮助企业做好AI创新，驶向更美好的未来。

该试读文章来自《极客头条》，如需阅读全部文章，
请先领取课程

免费领取

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论