这就是 ChatGPT
[美] 斯蒂芬 • 沃尔弗拉姆(Stephen Wolfram)
计算机科学家、数学家和理论物理学家
509 人已学习
立即订阅
登录后,你可以任选4讲全文学习
课程目录
已更新 24 讲/共 30 讲
第2章 (5讲)
时长 02:51
时长 03:57
时长 08:18
时长 00:38
这就是 ChatGPT
15
15
1.0x
00:00/00:00
登录|注册

机器学习和神经网络的训练

微积分的应用
最小化损失
损失函数
不同的固有方式
外插
多个等效解决方案
高维空间中的方向
梯度下降
损失函数的减小
学习曲线
逐步调整权重
提供大量样例
局部最小值与全局最小值
权重的调整
泛化能力
根据样例训练
学习执行任务
结果的不确定性
权重调整
训练过程
神经网络的训练
习和神经网络的训练

该思维导图由 AI 生成,仅供参考

到目前为止,我们一直在讨论“已经知道”如何执行特定任务的神经网络。但神经网络之所以很有用(人脑中的神经网络大概也如此),原因不仅在于它可以执行各种任务,还在于它可以通过逐步“根据样例训练”来学习执行这些任务。
当构建一个神经网络来区分猫和狗的图像时,我们不需要编写一个程序来(比如)明确地找到胡须,只需要展示很多关于什么是猫和什么是狗的样例,然后让神经网络从中“机器学习”如何区分它们即可。
重点在于,已训练的神经网络能够对所展示的特定例子进行“泛化”。正如我们之前看到的,神经网络不仅能识别猫图像的样例的特定像素模式,还能基于我们眼中的某种“猫的典型特征”来区分图像。
神经网络的训练究竟是如何起效的呢?本质上,我们一直在尝试找到能使神经网络成功复现给定样例的权重。然后,我们依靠神经网络在这些样例“之间”进行“合理”的“插值”(或“泛化”)。
让我们看一个比“最近点”问题更简单的问题,只试着让神经网络学习如下函数。
对于这个任务,我们需要只有一个输入和一个输出的神经网络。
但是,应该使用什么样的权重呢?对于每组可能的权重,神经网络都将计算出某个函数。例如,下面是它对于几组随机选择的权重计算出的函数。
可以清楚地看到,这些函数与我们想要的函数相去甚远。那么,如何才能找到能够复现函数的权重呢?
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文介绍了机器学习和神经网络的训练过程。神经网络通过逐步“根据样例训练”来学习执行特定任务,例如区分猫和狗的图像。训练的关键在于找到能够复现给定样例的权重,并通过逐步调整权重来最小化损失函数,以使神经网络成功复现所需函数。文章还提到了微积分的链式法则可以帮助解开神经网络中连续各层所做操作的谜团,从而找到使损失最小化的权重。此外,文章指出在涉及许多权重时,进行最小化可能会更容易,这也是深度学习在涉及许多权重时取得突破的原因之一。最后,文章强调了在实际的神经网络训练中,通常会做出许多随机选择,导致产生一些“不同但等效”的解决方案,这些解决方案都会有略微不同的行为。文章内容深入浅出地介绍了神经网络训练的基本原理和技术特点,对于想要了解机器学习和神经网络训练的读者具有很高的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《这就是 ChatGPT》
立即购买
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • 蒋波
    在实际的神经网络训练中,通常会做出许多随机选择,导致产生一些“不同但等效”的解决方案,就像下面这些一样。 但是每个这样的“不同解决方案”都会有略微不同的行为。假如在我们给出训练样例的区域之外进行“外插”(extrapolation),可能会得到截然不同的结果。 这段讲述没有明白是什么意思?这是在说模型在不同权重设置下有着等效的能力,但是在处理什么情况会有截然不同的结果呢?
    2024-02-28归属地:四川
收起评论
显示
设置
留言
1
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部