AI 前线
InfoQ
AI 前线团队
2898 人已学习
免费领取
课程目录
已更新 37 讲/共 1000 讲
AI 前线
15
15
1.0x
00:00/00:00
登录|注册

马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!

作者 | 李忠良、褚杏娟、核子可乐
引言:还记得 3 月 18 日,马斯克开源 Grok 的那一刻吗?如今,Grok 1.5 即将登场,其卓越的编码与数学处理能力、更深入的上下文理解(可处理高达 12.8 万 Tokens)以及更精准的长文本检索能力,令人震惊。马斯克就是马斯克,这速度,何尝不让人叹服。Grok-1.5 在未来几天即将在 X 上与开发者见面。

Grok-1.5 登场

当地时间 3 月 28 日,马斯克发布了 Grok-1.5,这是一个具有前所未有的长上下文支持和高级推理能力的新型人工智能模型。Grok-1.5,作为该系列的最新版本,预计将在未来几天向早期测试者和 X 平台的现有用户开放。借助于两周前公开的 Grok-1 模型权重和网络架构,该团队展现了至去年 11 月为止的技术成就,并自那以后在推理及问题解决方面取得了显著进展。

能力与推理

Grok-1.5 最显著的改进之一,就是更强大的编码与数学相关任务性能。在团队的实验中,Grok-1.5 在 MATH 基准测试上取得了 50.6% 的得分,在 GSM8k 基准测试上取得了 90% 得分——这两项数学基准测试涵盖从小学到高中的各类竞赛问题。此外,Grok-1.5 在评估代码生成与问题解决能力的 HumanEval 基准测试中得分为 74.1%。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

1. 马斯克发布了Grok-1.5,这是一个具有前所未有的长上下文支持和高级推理能力的新型人工智能模型。 2. Grok-1.5在数学基准测试和评估代码生成与问题解决能力的HumanEval基准测试中取得了显著进展,展现出更强大的编码与数学相关任务性能。 3. Grok-1.5具有处理多达128K个tokens的长上下文理解能力,使得其能够消化大部头文档中的信息,并展示出强大的检索能力。 4. Grok-1.5的基础设施以基于JAX、Rust和Kubernetes的自定义分布式训练框架为基础,使团队能够以最小的投入建立起设计原型,并大规模训练新型架构。 5. Grok-1.5在MMLU测试中以81.5%的得分领先,HumanEval测试中以74.1%的得分胜出,并在GSM8k测试中以90%的惊人得分远超DBRX的66.9%。 6. Grok-1.5在长文本上,上下文窗口中处理多达128K个tokens,远超于DBRX的32K。 7. Grok-1.5的发布引起了开发者的热切期待,他们对其新功能充满期待,希望能够尽快试用。 8. Grok-1.5的价格相对较为经济,与其他模型相比具有更高的性价比。 9. Grok-1.5的发布使得人工智能领域的竞争更加激烈,各大模型相继发布并宣称超越对手,预示着人工智能发展的黄金时代。

该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部
文章页面操作
MAC
windows
作用
esc
esc
退出沉浸式阅读
shift + f
f11
进入/退出沉浸式
command + ⬆️
home
滚动到页面顶部
command + ⬇️
end
滚动到页面底部
⬅️ (仅针对订阅)
⬅️ (仅针对订阅)
上一篇
➡️ (仅针对订阅)
➡️ (仅针对订阅)
下一篇
command + j
page up
向下滚动一屏
command + k
page down
向上滚动一屏
p
p
音频播放/暂停
j
j
向下滚动一点
k
k
向上滚动一点
空格
空格
向下滚动一屏
播放器操作
MAC
windows
作用
esc
esc
退出全屏
⬅️
⬅️
快退
➡️
➡️
快进
空格
空格
视频播放/暂停(视频全屏时生效)