01｜认知升级：你心中的AI大模型长啥样？

Tyler

你好，我是 Tyler。从今天起，我们正式开始学习“AI 大模型架构”。
最近，各大媒体热搜上都在讨论 AI 大模型，国内外的各个大厂也都在相关领域开疆拓土。“AI 大模型将成为新一代应用平台”的观点，似乎已经成为各大公司的共识。
相信你学习这门课程的目的，也是为了在 AI 大模型的技术浪潮下，尽早熟悉甚至驾驭这个新的基础设施，走在技术的前沿。不过在开始之前，我想先问你一个问题：学习一个全新领域的时候，你一般第一件事会做什么？
我的习惯是 follow 数学上的方法，先搞清楚这个领域的“公理”有哪些，因为它是该领域的共识，如果不能在一开始，就和领域中的大多数人建立共识，后续所有的认识都会出现偏差。所以在正式开始学习之前，我们有必要花点时间了解这些“公理”以及它们背后的历史，让自己的认知更接近该领域的专家，这样后面的学习才能事半功倍。
今天这节课里，我们主要会讨论后面这几个问题。
AI 大模型是什么？
AI 大模型能做什么？
为什么说 AI 大模型是新一代应用平台？
理解了这几个问题，你才能真正进入到属于技术人的 AI 大模型世界。
AI 大模型是什么？我相信在过去的一年里，你经常听到各种名词，比如大模型、AI 模型、生成式 AI、AIGC、生成式 AI 大模型等等。好像机器突然被魔法棒点中，瞬间觉醒了智能，现在已经学会了诗歌和绘画，接下来就要开始统治和奴役人类。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

AI大模型是当前热门话题，本文从学习AI大模型的角度出发，探讨了AI大模型的定义、应用和技术发展。文章首先指出“大模型”并非学术分类，而更常用的术语是基础模型。基础模型是一种大型机器学习模型，通常在大量数据上进行大规模训练，以适应各类下游任务。此外，文章介绍了AIGC（生成式人工智能）应用，指出大模型技术的发展源于AI模型追求“大”的趋势。随着数据规模和计算能力的增加，模型参数规模不断扩大，以适应更大规模的训练数据。最终，文章以“一切皆为训练数据”的时代为结尾，强调了大模型的发展是一个持续的过程。整体而言，本文深入浅出地介绍了AI大模型的概念、发展和应用，为读者提供了全面的认知升级。 AI大模型的兴起不仅仅是由于模型规模变大，而是多个因素相互作用形成的。大型语言模型展现出了出色的涌现、思维链和上下文学习的能力，跨模态建模能力的发展让同一个模型能够处理多种形式的数据。生成式模型的交互方式也大大提高了产品的渗透率。然而，这些前提条件的实现都依赖于存储和计算能力的持续发展。大模型在语言翻译、创意策划、文章创作和代码编写等任务上表现出色，但也存在时效性和因果推断方面的局限。工业级的大模型系统需要优雅应对这些局限，而大模型系统平台将成为强大的生产工具，极大地提升个人生产效率。马斯克呼吁暂停训练更强大的人工智能，担心人工智能系统将达到不可控程度，造成不可预知的风险。这引发了对技术路径和成本的思考。整体而言，本文深入探讨了AI大模型的技术特点和发展趋势，为读者提供了全面的认知升级，同时引发了对人工智能发展的深刻思考。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 大模型系统实战》，新⼈⾸单¥59

立即购买

登录后留言

全部留言(9)

最新
精选

润泽
置顶
请问学习本课程、以及从事大模型工作，需要具备较强的数学基础吗？
作者回复: 你好，润泽！由于大模型产业分工具有一定的分层特点（如市场、运营、产品、工程师和算法专家等），所以我们在课程中也采用了自顶向下的知识排布方法。我们将内容划分为基础、进阶和高阶阶段。在基础和绝大多数进阶内容中，无需直接涉及数学知识；在少部分进阶和一部分高阶内容上，需要大家具备一些数学能力。我们在第32节总结了课程的内容和设计理念，相信能够解答你的疑问。
2024-03-05归属地：北京


aLong
置顶
结合最近OpenAI出现的反转剧情来看。 “以担心人工智能系统将达到不可控程度” 这方面的内容确实存在的问题。尤其是在 IILYA 的一些课看法中感觉到IILYA对OpenAI安全政策的批评是具有建设性的。OpenAI应该认真考虑IILYA的建议，并采取措施加强AI安全。具体来说，两者有以下相似之处： 1. 都认为AI技术存在一定的风险。 2. 都认为需要采取措施加强AI安全。 3. 都建议建立独立的机构来监督AI技术的开发和使用。而马斯克旗下的Grok。又是联名信后的另一个产物，我不知道他内心是怎么想的。挺半年这个措施，如果是为了商量讨论怎么来制定安全有关的会议，我想那可能还是单纯的考虑安全问题。但是Grok的出现，以及他平时宣传风格。马斯克的安全意识还是要加引号的。
作者回复: 你好，aLong！回答得很好，从头像看得出你是一个很懂马斯克的人 :)
2023-11-23归属地：北京

2
_MISSYOURLOVE
目前的工作就是调用openAI的接口，为其包装一层供公司各部门的业务人员使用，提高效率。希望能在老师得带领下，踏上这趟不一样的列车
作者回复: 你好，MISSYOURLOVE！相信在工作中，你已经对大模型技术有了一些直观认识。我们未来的工作会和大模型技术融合的越来越深，坚持下去一定会有所收获，加油！
2023-08-15归属地：北京

5
周晓英
个人感觉马斯克的担心有一定的道理，由于大模型已经学习了海量人类知识和经验，且具备学习和推理能力，按照这个发展趋势，出现接近或超越人类的智商是有可能的，且这一点如果被坏人利用，很容易对人类产生伤害。AI技术是双刃剑，必要的监管是需要的。但马斯克的公开信或许也有自己的目的，用于拖延一下对手的发展速度，为自己企业推出业界最具竞争力的大模型之一争取时间。但从另外一个角度思考，出现强人工智能、超人工智能需要大量的计算资源、数据和时间进行训练和优化，目前可能不会很快出现这一情况？
作者回复: 你好，周晓英！很好，你的回答说明你已经可以独立判断该领域的信息了👍🏻
2023-09-03归属地：美国

2
Juha
7月13日，「网信中国」官方发布了：「生成式人工智能服务管理暂行办法」，将于8月15日正式施行。对于这个，老师是啥看法呢～
作者回复: 你好，Juha！这个问题非常具体，说明你一直在紧密关注这个领域。出于工作的需要，我也一直在参与AIGC相关标准的制定，这里从我个人的角度说一下我比较关注的内容。首先，需要注意的是该问题的具体范围，主要面向境内的服务。其次，该办法鼓励在算力方面进行贡献，并有序地开放公共数据。第三点则是强调服务提供者要对AIGC生成的内容进行主动标识，我相信您在一些互联网应用中已经注意到类似于“此内容由AI生成”的提示了。最后，对于涉及舆论的AIGC服务，务必履行相关的备案手续。 AIGC 是一个新兴领域，我们需要共同努力，确保其健康发展。
2023-08-15归属地：北京
2
2
静心
马同志是在表示：你们跑得太快了，我已经追赶不上你们了，等等我，咱一起跑！
编辑回复: 哈哈哈哈～
2023-10-18归属地：北京

1
kylin
老师，请问：重要的 AI 应用，如 AlphaZero 和无人驾驶，能够以较低成本自动生成训练数据，能不能举个具体的例子说明如何自动生成训练数据呢
作者回复: 同学你好，问题很好。我们知道 AlphaZero 是一个自我对弈、自我进化的围棋机器人，它在无休止的自我对弈过程中，积累的历史棋谱都是可用的训练数据，这个过程几乎不需要人的参与。无人驾驶可以使用诸如街景车采集过程中的驾驶数据，作为种子数据来训练模型。当无人车具备一定的自动驾驶能力后，只需要安全员陪同，就能自主产生行车记录数据，用于模型训练。顺便预告一下，我们会讲到强化学习算法，这两个场景都用了这个方法。
2023-08-14归属地：吉林

1
Lucky+
马斯克的担忧是基于人工智能的快速发展和潜在的滥用。他担心的“不可控的程度”可能是指强人工智能或超级智能，这种智能可能超过人类智能，有自我意识和自我改进的能力。如果没有适当的控制和道德框架，这样的系统可能会做出对人类不利的决策。通向这种情况的技术路径可能包括深度学习、机器学习、神经网络和其他人工智能技术的进一步发展和完善。这些技术的发展需要大量的研究和开发，以及大量的计算资源和数据。因此，成本可能会非常高。然而，这并不意味着我们应该停止发展人工智能。相反，我们应该制定更严格的法规和道德框架，以确保人工智能的安全和有益的使用。同时，我们也需要对人工智能的潜在风险有更深入的了解和研究。
作者回复: 你好，Lucky！回答得很好，在后面的课程里也期待你的留言！
2023-09-04归属地：北京


GAC·DU
现在这个“大胖孩子”已经在风口上顺势起飞，不禁要问为啥停训六个月，而不是停训六年，六个月能有什么意义，暂缓一两个大版本的跨越？估计是成老马节奏带不动了吧
作者回复: 能将大模型比作大胖孩子，说明你真的有认真听课！至于课后题的答案，我们会在下一讲揭晓。
2023-08-14归属地：北京



收起评论