AI 前线
InfoQ
AI 前线团队
3818 人已学习
免费领取
课程目录
已更新 54 讲/共 1000 讲
AI 前线
15
15
1.0x
00:00/00:00
登录|注册

26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要

出品|InfoQ 《大模型领航者》
访谈主持|霍太稳,极客邦科技创始人兼 CEO
访谈嘉宾|曾国洋,面壁智能 CTO
作者|褚杏娟
“尽管有所谓的‘百模大战’,但实际上,国内真正能够成功训练大模型并掌握相关技术的团队并不多。”面壁智能 CTO 曾国洋说道,“不是简单地训练出一个模型就意味着掌握了全部技术。”
面壁智能起于一群学术极客。2021 年,清华大学计算机系长聘副教授刘知远的牵头成立了面壁智能成立,团队成员主要来自清华大学 NLP 实验室,而曾国洋成为这家初创公司的技术 1 号位。
曾国洋如今更以“天才少年”的形象被人熟知:8 岁学编程、高中去旷视实习、大二加入清华 NLP 实验室。人们通常很难将眼前这个 98 年的少年,跟“BMTrain、BMInf 主要作者”“OpenBMB 开源社区发起人”“当红大模型创业公司 CTO”等联系在一起,但 26 岁的他确实已经被推到了大模型时代的舞台中央。

从自己 coding 到看别人 coding

2022 年 8 月,面壁智能开始公司化运作。直到去年年初,面壁智能只有 10 个人不到。当时的曾国洋依然活跃在编程一线。
作为程序员的曾国洋,是早期第一批申请试用 GitHub Copilot 的用户之一。他把 AI 看成是合作伙伴:AI 辅助程序员完成某些任务,而程序员则可以专注于更具创造性和战略性的工作。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

1. 面壁智能是由清华大学 NLP 实验室成员组成的初创公司,致力于训练大模型和掌握相关技术。 2. 公司的CTO曾国洋在8岁学习编程,高中实习于旷视,大二加入清华NLP实验室,现年26岁已成为大模型时代的关键人物。 3. 面壁智能的团队研发速度快,内部迭代频率已经从两周缩短到一周一次,对自己所做的事情有了更深入的思考。 4. 面壁智能认为未来大模型的发展应该朝着高效率的方向发展,以小尺寸端侧模型的竞技场,并且还将其完全开源,以帮助大模型行业整体技术发展。 5. 面壁智能的CEO李大海认为,无论 to B 还是 to C,本质上都是“大模型 + Agent 的上层应用”,并提出了一种分工模式:一些简单的、重复性的任务由小型的、特定领域的模型来处理;而更复杂的、需要高级认知能力的思考任务则可能由大型通用模型来完成。 6. 大模型公司可能会对依赖传统技术或缺乏足够技术储备的应用公司产生影响,但应用公司也有自己的竞争优势,比如对特定市场的深入理解、强大的客户关系和品牌忠诚度等。 7. 大模型简化、加速开发任务是正在发生的事情,技术人员并不需要掌握大量的编程代码,更重要的是他们对最终产品的理解能力。 8. 面壁智能的目标是实现通用人工智能,团队有一个清晰的路线图,包括在文本模态上要达到的效果、未来向多模态和具身智能的转变等规划。 9. 面壁智能将继续专注于模型的研发和优化,以实现自己的 AGI 理想。

该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部