AI 大模型系统实战
Tyler
前亚马逊应用科学家,头部大厂 AIGC 算法技术负责人
6826 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
结束语&结课测试 (2讲)
AI 大模型系统实战
15
15
1.0x
00:00/00:00
登录|注册

01|认知升级:你心中的AI大模型长啥样?

你好,我是 Tyler。从今天起,我们正式开始学习“AI 大模型架构”。
最近,各大媒体热搜上都在讨论 AI 大模型,国内外的各个大厂也都在相关领域开疆拓土。“AI 大模型将成为新一代应用平台”的观点,似乎已经成为各大公司的共识。
相信你学习这门课程的目的,也是为了在 AI 大模型的技术浪潮下,尽早熟悉甚至驾驭这个新的基础设施,走在技术的前沿。不过在开始之前,我想先问你一个问题:学习一个全新领域的时候,你一般第一件事会做什么?
我的习惯是 follow 数学上的方法,先搞清楚这个领域的“公理”有哪些,因为它是该领域的共识,如果不能在一开始,就和领域中的大多数人建立共识,后续所有的认识都会出现偏差。所以在正式开始学习之前,我们有必要花点时间了解这些“公理”以及它们背后的历史,让自己的认知更接近该领域的专家,这样后面的学习才能事半功倍。
今天这节课里,我们主要会讨论后面这几个问题。
AI 大模型是什么?
AI 大模型能做什么?
为什么说 AI 大模型是新一代应用平台?
理解了这几个问题,你才能真正进入到属于技术人的 AI 大模型世界。

AI 大模型是什么?

我相信在过去的一年里,你经常听到各种名词,比如大模型、AI 模型、生成式 AI、AIGC、生成式 AI 大模型等等。好像机器突然被魔法棒点中,瞬间觉醒了智能,现在已经学会了诗歌和绘画,接下来就要开始统治和奴役人类。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

AI大模型是当前热门话题,本文从学习AI大模型的角度出发,探讨了AI大模型的定义、应用和技术发展。文章首先指出“大模型”并非学术分类,而更常用的术语是基础模型。基础模型是一种大型机器学习模型,通常在大量数据上进行大规模训练,以适应各类下游任务。此外,文章介绍了AIGC(生成式人工智能)应用,指出大模型技术的发展源于AI模型追求“大”的趋势。随着数据规模和计算能力的增加,模型参数规模不断扩大,以适应更大规模的训练数据。最终,文章以“一切皆为训练数据”的时代为结尾,强调了大模型的发展是一个持续的过程。整体而言,本文深入浅出地介绍了AI大模型的概念、发展和应用,为读者提供了全面的认知升级。 AI大模型的兴起不仅仅是由于模型规模变大,而是多个因素相互作用形成的。大型语言模型展现出了出色的涌现、思维链和上下文学习的能力,跨模态建模能力的发展让同一个模型能够处理多种形式的数据。生成式模型的交互方式也大大提高了产品的渗透率。然而,这些前提条件的实现都依赖于存储和计算能力的持续发展。大模型在语言翻译、创意策划、文章创作和代码编写等任务上表现出色,但也存在时效性和因果推断方面的局限。工业级的大模型系统需要优雅应对这些局限,而大模型系统平台将成为强大的生产工具,极大地提升个人生产效率。 马斯克呼吁暂停训练更强大的人工智能,担心人工智能系统将达到不可控程度,造成不可预知的风险。这引发了对技术路径和成本的思考。整体而言,本文深入探讨了AI大模型的技术特点和发展趋势,为读者提供了全面的认知升级,同时引发了对人工智能发展的深刻思考。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 大模型系统实战》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(9)

  • 最新
  • 精选
  • 润泽
    置顶
    请问学习本课程、以及从事大模型工作,需要具备较强的数学基础吗?

    作者回复: 你好,润泽!由于大模型产业分工具有一定的分层特点(如市场、运营、产品、工程师和算法专家等),所以我们在课程中也采用了自顶向下的知识排布方法。 我们将内容划分为基础、进阶和高阶阶段。在基础和绝大多数进阶内容中,无需直接涉及数学知识;在少部分进阶和一部分高阶内容上,需要大家具备一些数学能力。我们在第32节总结了课程的内容和设计理念,相信能够解答你的疑问。

    2024-03-05归属地:北京
  • aLong
    置顶
    结合最近OpenAI出现的反转剧情来看。 “以担心人工智能系统将达到不可控程度” 这方面的内容确实存在的问题。 尤其是在 IILYA 的一些课看法中感觉到IILYA对OpenAI安全政策的批评是具有建设性的。OpenAI应该认真考虑IILYA的建议,并采取措施加强AI安全。 具体来说,两者有以下相似之处: 1. 都认为AI技术存在一定的风险。 2. 都认为需要采取措施加强AI安全。 3. 都建议建立独立的机构来监督AI技术的开发和使用。 而马斯克旗下的Grok。又是联名信后的另一个产物,我不知道他内心是怎么想的。挺半年这个措施,如果是为了商量讨论怎么来制定安全有关的会议,我想那可能还是单纯的考虑安全问题。但是Grok的出现,以及他平时宣传风格。马斯克的安全意识还是要加引号的。

    作者回复: 你好,aLong!回答得很好,从头像看得出你是一个很懂马斯克的人 :)

    2023-11-23归属地:北京
    2
  • _MISSYOURLOVE
    目前的工作就是调用openAI的接口,为其包装一层供公司各部门的业务人员使用,提高效率。希望能在老师得带领下,踏上这趟不一样的列车

    作者回复: 你好,MISSYOURLOVE!相信在工作中,你已经对大模型技术有了一些直观认识。我们未来的工作会和大模型技术融合的越来越深,坚持下去一定会有所收获,加油!

    2023-08-15归属地:北京
    5
  • 周晓英
    个人感觉马斯克的担心有一定的道理,由于大模型已经学习了海量人类知识和经验,且具备学习和推理能力,按照这个发展趋势,出现接近或超越人类的智商是有可能的,且这一点如果被坏人利用,很容易对人类产生伤害。AI技术是双刃剑,必要的监管是需要的。但马斯克的公开信或许也有自己的目的,用于拖延一下对手的发展速度,为自己企业推出业界最具竞争力的大模型之一争取时间。 但从另外一个角度思考,出现强人工智能、超人工智能需要大量的计算资源、数据和时间进行训练和优化,目前可能不会很快出现这一情况?

    作者回复: 你好,周晓英!很好,你的回答说明你已经可以独立判断该领域的信息了👍🏻

    2023-09-03归属地:美国
    2
  • Juha
    7月13日,「网信中国」官方发布了:「生成式人工智能服务管理暂行办法」,将于8月15日正式施行。 对于这个,老师是啥看法呢~

    作者回复: 你好,Juha!这个问题非常具体,说明你一直在紧密关注这个领域。出于工作的需要,我也一直在参与AIGC相关标准的制定,这里从我个人的角度说一下我比较关注的内容。 首先,需要注意的是该问题的具体范围,主要面向境内的服务。其次,该办法鼓励在算力方面进行贡献,并有序地开放公共数据。第三点则是强调服务提供者要对AIGC生成的内容进行主动标识,我相信您在一些互联网应用中已经注意到类似于“此内容由AI生成”的提示了。最后,对于涉及舆论的AIGC服务,务必履行相关的备案手续。 AIGC 是一个新兴领域,我们需要共同努力,确保其健康发展。

    2023-08-15归属地:北京
    2
    2
  • 静心
    马同志是在表示:你们跑得太快了,我已经追赶不上你们了,等等我,咱一起跑!

    编辑回复: 哈哈哈哈~

    2023-10-18归属地:北京
    1
  • kylin
    老师,请问:重要的 AI 应用,如 AlphaZero 和无人驾驶,能够以较低成本自动生成训练数据,能不能举个具体的例子说明如何自动生成训练数据呢

    作者回复: 同学你好,问题很好。我们知道 AlphaZero 是一个自我对弈、自我进化的围棋机器人,它在无休止的自我对弈过程中,积累的历史棋谱都是可用的训练数据,这个过程几乎不需要人的参与。 无人驾驶可以使用诸如街景车采集过程中的驾驶数据,作为种子数据来训练模型。当无人车具备一定的自动驾驶能力后,只需要安全员陪同,就能自主产生行车记录数据,用于模型训练。 顺便预告一下,我们会讲到强化学习算法,这两个场景都用了这个方法。

    2023-08-14归属地:吉林
    1
  • Lucky+
    马斯克的担忧是基于人工智能的快速发展和潜在的滥用。他担心的“不可控的程度”可能是指强人工智能或超级智能,这种智能可能超过人类智能,有自我意识和自我改进的能力。如果没有适当的控制和道德框架,这样的系统可能会做出对人类不利的决策。 通向这种情况的技术路径可能包括深度学习、机器学习、神经网络和其他人工智能技术的进一步发展和完善。这些技术的发展需要大量的研究和开发,以及大量的计算资源和数据。因此,成本可能会非常高。 然而,这并不意味着我们应该停止发展人工智能。相反,我们应该制定更严格的法规和道德框架,以确保人工智能的安全和有益的使用。同时,我们也需要对人工智能的潜在风险有更深入的了解和研究。

    作者回复: 你好,Lucky!回答得很好,在后面的课程里也期待你的留言!

    2023-09-04归属地:北京
  • GAC·DU
    现在这个“大胖孩子”已经在风口上顺势起飞,不禁要问为啥停训六个月,而不是停训六年,六个月能有什么意义,暂缓一两个大版本的跨越?估计是成老马节奏带不动了吧

    作者回复: 能将大模型比作大胖孩子,说明你真的有认真听课!至于课后题的答案,我们会在下一讲揭晓。

    2023-08-14归属地:北京
收起评论
显示
设置
留言
9
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部