斯坦福AI团队“套壳”清华系开源大模型被实锤！被揭穿后全网删库跑路

冬梅

5 月 29 日，一个来自斯坦福的作者团队在 Medium 上发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章，文章中称他们训练出了一个比 GPT-4V、Gemini Ultra、Claude Opus 更强的 SOTA 开源多模态模型，尺寸比 GPT4-V 小 100 倍，训练成本仅需 500 美元。
斯坦福 AI 团队“套壳”清华系开源大模型被实锤该团队成员 Aksh Garg 也在 X（原 Twitter）上发贴介绍了这一模型的特点。没过多久该帖的浏览量已超过 30 万，被转发了 300 多次，Llama 3-V 的项目一下子冲到了 HuggingFace 首页。
随着该项目热度的持续走高，不少 X 和 HuggingFace 上的网友注意到，Llama 3-V 总是让人有种似曾相识的感觉，好像在哪里见到过！
网友们接着深扒后发现， Llama 3-V 似乎，有点，好像是套壳了清华系开源大模型 MiniCPM-Llama3-V 2.5。
据悉，MiniCPM-Llama3-V 2.5 是由清华系 AI 公司面壁智能推出并开源的 MiniCPM 系列最新的端侧多模态模型，总参数量为 8B，支持 30+ 种语言，多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型，OCR 能力及指令跟随能力得到进一步提升，可精准识别难图、长图、长文本。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

1. 斯坦福AI团队声称训练出了一个比GPT-4V、Gemini Ultra、Claude Opus 更强的SOTA 开源多模态模型，尺寸比GPT4-V小100 倍，训练成本仅需500美元。 2. 网友发现斯坦福团队的模型Llama 3-V似乎是套壳了清华系开源大模型MiniCPM-Llama3-V 2.5，指出两者的模型结构和代码几乎完全相同。 3. 网友在Llama3-V的 GitHub Issue上发布质疑，评论很快被Llama3-V团队删除，但发布质疑的网友提前截图保存了自己的内容。 4. 网友列举了Llama3-V“套壳”MiniCPM-Llama3-V 2.5的四点证据，包括模型结构和代码相似、Llama3-V的代码似乎就是MiniCPM-Llama3-V 2.5的代码等。 5. 面壁智能团队指出Llama3-V的作者似乎并不完全理解MiniCPM-Llama3-V 2.5的架构，甚至也不理解他们自己的代码。

该试读文章来自《AI 前线》，如需阅读全部文章，
请先领取课程

免费领取

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论