斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
冬梅

5 月 29 日,一个来自斯坦福的作者团队在 Medium 上发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,文章中称他们训练出了一个比 GPT-4V、Gemini Ultra、Claude Opus 更强的 SOTA 开源多模态模型,尺寸比 GPT4-V 小 100 倍,训练成本仅需 500 美元。
斯坦福 AI 团队“套壳”清华系开源大模型被实锤
该团队成员 Aksh Garg 也在 X(原 Twitter)上发贴介绍了这一模型的特点。没过多久该帖的浏览量已超过 30 万,被转发了 300 多次,Llama 3-V 的项目一下子冲到了 HuggingFace 首页。

随着该项目热度的持续走高,不少 X 和 HuggingFace 上的网友注意到,Llama 3-V 总是让人有种似曾相识的感觉,好像在哪里见到过!

网友们接着深扒后发现, Llama 3-V 似乎,有点,好像是套壳了清华系开源大模型 MiniCPM-Llama3-V 2.5。
据悉,MiniCPM-Llama3-V 2.5 是由清华系 AI 公司面壁智能推出并开源的 MiniCPM 系列最新的端侧多模态模型,总参数量为 8B,支持 30+ 种语言,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力得到进一步提升,可精准识别难图、长图、长文本。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. 斯坦福AI团队声称训练出了一个比GPT-4V、Gemini Ultra、Claude Opus 更强的SOTA 开源多模态模型,尺寸比GPT4-V小100 倍,训练成本仅需500美元。 2. 网友发现斯坦福团队的模型Llama 3-V似乎是套壳了清华系开源大模型MiniCPM-Llama3-V 2.5,指出两者的模型结构和代码几乎完全相同。 3. 网友在Llama3-V的 GitHub Issue上发布质疑,评论很快被Llama3-V团队删除,但发布质疑的网友提前截图保存了自己的内容。 4. 网友列举了Llama3-V“套壳”MiniCPM-Llama3-V 2.5的四点证据,包括模型结构和代码相似、Llama3-V的代码似乎就是MiniCPM-Llama3-V 2.5的代码等。 5. 面壁智能团队指出Llama3-V的作者似乎并不完全理解MiniCPM-Llama3-V 2.5的架构,甚至也不理解他们自己的代码。
该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论