AI 前线
InfoQ
AI 前线团队
5249 人已学习
免费领取
课程目录
已更新 75 讲/共 1000 讲
AI 前线
15
15
1.0x
00:00/00:00
登录|注册

斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路

5 月 29 日,一个来自斯坦福的作者团队在 Medium 上发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,文章中称他们训练出了一个比 GPT-4V、Gemini Ultra、Claude Opus 更强的 SOTA 开源多模态模型,尺寸比 GPT4-V 小 100 倍,训练成本仅需 500 美元。

斯坦福 AI 团队“套壳”清华系开源大模型被实锤

该团队成员 Aksh Garg 也在 X(原 Twitter)上发贴介绍了这一模型的特点。没过多久该帖的浏览量已超过 30 万,被转发了 300 多次,Llama 3-V 的项目一下子冲到了 HuggingFace 首页。
随着该项目热度的持续走高,不少 X 和 HuggingFace 上的网友注意到,Llama 3-V 总是让人有种似曾相识的感觉,好像在哪里见到过!
网友们接着深扒后发现, Llama 3-V 似乎,有点,好像是套壳了清华系开源大模型 MiniCPM-Llama3-V 2.5。
据悉,MiniCPM-Llama3-V 2.5 是由清华系 AI 公司面壁智能推出并开源的 MiniCPM 系列最新的端侧多模态模型,总参数量为 8B,支持 30+ 种语言,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力得到进一步提升,可精准识别难图、长图、长文本。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

1. 斯坦福AI团队声称训练出了一个比GPT-4V、Gemini Ultra、Claude Opus 更强的SOTA 开源多模态模型,尺寸比GPT4-V小100 倍,训练成本仅需500美元。 2. 网友发现斯坦福团队的模型Llama 3-V似乎是套壳了清华系开源大模型MiniCPM-Llama3-V 2.5,指出两者的模型结构和代码几乎完全相同。 3. 网友在Llama3-V的 GitHub Issue上发布质疑,评论很快被Llama3-V团队删除,但发布质疑的网友提前截图保存了自己的内容。 4. 网友列举了Llama3-V“套壳”MiniCPM-Llama3-V 2.5的四点证据,包括模型结构和代码相似、Llama3-V的代码似乎就是MiniCPM-Llama3-V 2.5的代码等。 5. 面壁智能团队指出Llama3-V的作者似乎并不完全理解MiniCPM-Llama3-V 2.5的架构,甚至也不理解他们自己的代码。

该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部