马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!
李忠良


作者 | 李忠良、褚杏娟、核子可乐
引言:还记得 3 月 18 日,马斯克开源 Grok 的那一刻吗?如今,Grok 1.5 即将登场,其卓越的编码与数学处理能力、更深入的上下文理解(可处理高达 12.8 万 Tokens)以及更精准的长文本检索能力,令人震惊。马斯克就是马斯克,这速度,何尝不让人叹服。Grok-1.5 在未来几天即将在 X 上与开发者见面。
Grok-1.5 登场
当地时间 3 月 28 日,马斯克发布了 Grok-1.5,这是一个具有前所未有的长上下文支持和高级推理能力的新型人工智能模型。Grok-1.5,作为该系列的最新版本,预计将在未来几天向早期测试者和 X 平台的现有用户开放。借助于两周前公开的 Grok-1 模型权重和网络架构,该团队展现了至去年 11 月为止的技术成就,并自那以后在推理及问题解决方面取得了显著进展。
能力与推理
Grok-1.5 最显著的改进之一,就是更强大的编码与数学相关任务性能。在团队的实验中,Grok-1.5 在 MATH 基准测试上取得了 50.6% 的得分,在 GSM8k 基准测试上取得了 90% 得分——这两项数学基准测试涵盖从小学到高中的各类竞赛问题。此外,Grok-1.5 在评估代码生成与问题解决能力的 HumanEval 基准测试中得分为 74.1%。

公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. 马斯克发布了Grok-1.5,这是一个具有前所未有的长上下文支持和高级推理能力的新型人工智能模型。 2. Grok-1.5在数学基准测试和评估代码生成与问题解决能力的HumanEval基准测试中取得了显著进展,展现出更强大的编码与数学相关任务性能。 3. Grok-1.5具有处理多达128K个tokens的长上下文理解能力,使得其能够消化大部头文档中的信息,并展示出强大的检索能力。 4. Grok-1.5的基础设施以基于JAX、Rust和Kubernetes的自定义分布式训练框架为基础,使团队能够以最小的投入建立起设计原型,并大规模训练新型架构。 5. Grok-1.5在MMLU测试中以81.5%的得分领先,HumanEval测试中以74.1%的得分胜出,并在GSM8k测试中以90%的惊人得分远超DBRX的66.9%。 6. Grok-1.5在长文本上,上下文窗口中处理多达128K个tokens,远超于DBRX的32K。 7. Grok-1.5的发布引起了开发者的热切期待,他们对其新功能充满期待,希望能够尽快试用。 8. Grok-1.5的价格相对较为经济,与其他模型相比具有更高的性价比。 9. Grok-1.5的发布使得人工智能领域的竞争更加激烈,各大模型相继发布并宣称超越对手,预示着人工智能发展的黄金时代。
该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论