这就是 ChatGPT
[美] 斯蒂芬 • 沃尔弗拉姆(Stephen Wolfram)
计算机科学家、数学家和理论物理学家
509 人已学习
立即订阅
登录后,你可以任选4讲全文学习
课程目录
已更新 24 讲/共 30 讲
第2章 (5讲)
时长 02:51
时长 03:57
时长 08:18
时长 00:38
这就是 ChatGPT
15
15
1.0x
00:00/00:00
登录|注册

在基础训练之外

调优原始网络
建立预测模型
人类评分
需要使用真正的计算工具
学习特定的计算答案
东西告诉一次,它就能“记住”
只需告诉一次
神经网络利用反馈
给予实际反馈
结果偏离正轨
神经网络生成文本
神经网络的算法限制
有效进步
人类积极互动
原始训练
展示大量现有文本
训练 ChatGPT

该思维导图由 AI 生成,仅供参考

训练 ChatGPT 的重头戏是在向其“展示”来自互联网、书籍等的大量现有文本,但事实证明训练还包括另一个(显然非常重要的)部分。
一旦根据被展示的原始文本语料库完成“原始训练”,ChatGPT 内部的神经网络就会准备开始生成自己的文本,根据提示续写,等等。尽管这些结果通常看起来合理,但它们很容易(特别是在较长的文本片段中)以“非类人”的方式“偏离正轨”。这不是通过对文本进行传统的统计可以轻易检测到的。但是,实际阅读文本的人很容易注意到。
构建 ChatGPT 的一个关键思想是,在“被动阅读”来自互联网等的内容之后添加一步:让人类积极地与 ChatGPT 互动,看看它产生了什么,并且在“如何成为一个好的聊天机器人”方面给予实际反馈。但是神经网络是如何利用这些反馈的呢?首先,仅仅让人类对神经网络的结果评分。然后,建立另一个神经网络模型来预测这些评分。现在,这个预测模型可以在原始网络上运行—本质上像损失函数一样—从而使用人类的反馈对原始网络进行“调优”。实践中的结果似乎对系统能否成功产生“类人”输出有很大的影响。
总的来说,有趣的是,“原本训练好的网络”似乎只需要很少的“介入”就能在特定方向上有效地进步。有人可能原本认为,为了让网络表现得好像学到了新东西,就必须为其训练算法、调整权重,等等。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文介绍了训练 ChatGPT 的重要性以及训练过程中的关键思想。除了向神经网络展示大量现有文本之外,人类积极地与 ChatGPT 互动并给予实际反馈也是至关重要的。作者指出,神经网络在捕捉信息方面存在算法限制,对于浅显的规则能够很好地表示和重现,但对于深度计算规则则行不通。此外,当神经网络接收到出乎意料的信息时,似乎无法成功地整合这些信息。作者认为,理解 ChatGPT 实际在做什么以及它与人类语言和思维结构之间的关系是至关重要的。总的来说,本文强调了训练 ChatGPT 的复杂性和挑战性,以及神经网络在处理信息时的局限性。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《这就是 ChatGPT》
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部