AI 大模型通识基础
筑牢大模型理论根基,洞察技术发展全景
彭靖田  LangChain 开发者,谷歌开发者专家
视频课
已完结·共 23 讲
|
1 人已学
|
收藏
立即购买
59

你将获得

"1. 系统掌握机器学习与深度学习核心理论,包括监督、非监督、半监督学习的典型算法与应用场景。​

2. 深入理解神经网络基础原理,熟悉神经元、激活函数、前向 / 反向传播等核心机制及经典网络结构。​
3. 全面认识 Transformer 架构核心逻辑,掌握注意力机制、多头注意力等关键技术原理。​
4. 明确大模型与传统模型的本质差异,了解稀疏注意力、混合专家模型等前沿技术及模型压缩加速方法。"

课程介绍

“本课程聚焦 AI 大模型的通识基础,为学员构建从机器学习底层理论到大模型前沿技术的完整知识框架。第一章围绕 “机器学习与深度学习理论基础” 展开,系统讲解监督学习(含线性回归、逻辑回归等典型算法及图像 / 文本分类等应用)、非监督学习(K-means 聚类、PCA 等算法与用户分群等场景)、半监督学习的核心逻辑;深入解析神经网络基础,包括神经元结构、激活函数(ReLU、Sigmoid 等)、前向传播与反向传播机制,以及损失函数与优化器(MSE、Adam 等)的作用原理;同时介绍全连接网络、CNN、RNN 等经典网络结构,以及 PyTorch、TensorFlow 等主流深度学习框架,夯实理论基础。​
第二章聚焦 “大模型发展全景与关键技术”,从 Transformer 架构的诞生切入,详解注意力模型、自注意力机制、多头注意力的核心原理,揭示其捕捉长距离依赖、并行计算特征的优势;明确大模型的定义与特点,对比传统模型的本质差异;深入介绍大模型技术突破与前沿趋势,包括稀疏注意力(Longformer、BigBird)降低计算复杂度的机制、混合专家模型(MoE)的动态路由逻辑(GShard、Switch Transformer),以及模型压缩加速的关键方法(量化、知识蒸馏)。通过本课程,学员将建立对 AI 大模型的系统性认知,为后续深入学习与实践奠定坚实基础。​”

课程目录

" 第一章:机器学习与深度学习理论基础
1. 机器学习基础

  • 监督学习:定义、典型算法(线性回归、逻辑回归、SVM、决策树、随机森林)、应用场景(图像分类、文本分类、回归预测)
  • 非监督学习:定义、典型算法(K-means 聚类、层次聚类、PCA、自编码器)、应用场景(用户分群、异常检测、数据降维)
  • 半监督学习:结合少量标注数据和大量未标注数据,提升模型性能

2. 神经网络与深度学习基础

  • 神经元与激活函数:输入、权重、偏置、激活函数(ReLU、Sigmoid、Tanh)
  • 前向传播与反向传播:计算输出、通过梯度下降优化权重
  • 损失函数与优化器:均方误差(MSE)、交叉熵(Cross-Entropy)、SGD、Adam、

3.RMSprop

  • 经典网络结构:全连接网络(FCN)、卷积神经网络(CNN)、循环神经网络(RNN)
  • 深度学习框架:PyTorch、TensorFlow、JAX

第二章:大模型发展全景与关键技术
1. 大模型发展全景与关键技术
Transformer 架构的诞生与应用

  • 注意力模型(Attention Model):捕捉长距离依赖
  • 自注意力机制(Self-Attention):语义理解的钥匙
  • 多头注意力(Multi-Head Attention):

2. 并行计算不同子空间的特征

  • 位置编码(Positional Encoding):引入序列位置信息
    大模型技术突破与前沿趋势
  • 大模型的定义与特点
  • 传统模型与大模型的差异
  • 稀疏注意力(Sparse Attention):降低计算复杂度(Longformer、BigBird)
  • 混合专家模型(MoE):动态路由机制(GShard、Switch Transformer)
  • 模型压缩与加速:量化(INT8、FP16)、知识蒸馏(小模型学习大模型的知识)"
查看更多

订阅须知

  1. 订阅成功后,推荐通过“极客时间”App 端、Web 端学习。
  2. 本课程为虚拟商品,交付形式为视频,一经订阅,概不退款。
  3. 订阅后分享海报,每邀一位好友订阅有现金返现。
  4. 戳此先充值再购课更划算,还有最新课表、超值赠品福利。
  5. 企业采购推荐使用“极客时间企业版”便捷安排员工学习计划,掌握团队学习仪表盘。
  6. 戳此申请学生认证,订阅课程享受原价 5 折优惠。
  7. 价格说明:划线价、订阅价为商品或服务的参考价,并非原价,该价格仅供参考。未划线价格为商品或服务的实时标价,具体成交价格根据商品或服务参加优惠活动,或使用优惠券、礼券、赠币等不同情形发生变化,最终实际成交价格以订单结算页价格为准。
讲师

彭靖田

LangChain 开发者,谷歌开发者专家

" 彭靖田,Google Developers Expert,加州大学圣迭戈分校访问学者,在美国期间从事深度学习与生物医疗技术的结合研究。毕业于浙江大学竺可桢学院,获计算机科学学士学位。 开源项目 Kubeflow 维护者,TensorFlow 贡献者,曾一度成为...查看更多
看过的人还看了
结构思考力 · 透过结构看表达
李忠秋
结构思考力研究中心创始人

13讲 | 720 人已学习

¥68¥189
如何高效使用 Coze 辅助自动办公化
尹会生
大模型领域连续创业者 & 技术战略专家

1讲 | 370 人已学习

¥29¥59
金融领域大语言模型实战
胡佳男
eBay 高级技术专家

12讲 | 719 人已学习

¥29¥39
高并发系统设计 40 问
唐扬
美图公司技术专家

49讲 | 50930 人已学习

¥59¥129
Web 协议详解与抓包实战
陶辉
智链达 CTO,前阿里云高级技术专家

121讲 | 43950 人已学习

¥68¥199
TypeScript 开发实战
梁宵
搜狗营销事业部高级架构师

47讲 | 34846 人已学习

¥59¥129