大模型安全实战课
从认知到防御,全方位建设大模型安全防线
赵帅  前极氪汽车资深算法专家
专栏
未完结·共 35 讲·已更新 2 讲·每周一 / 三 / 五更新
|
2 人已学
|
收藏

你将获得

  • 系统提升大模型安全治理能力
  • 8 类高频模型风险防御思路与手段
  • 大模型安全攻防演练与案例剖析
  • 即学即用的企业级安全实践指南

课程介绍

基于大模型能力开发的产品和服务越来越多,大模型安全问题也成了每位拥抱 AI 的开发者、产品人乃至技术人负责人绕不开的必答题。

在大模型应用的过程中,我们经常产生后面这些疑问:

  • “我们项目用开源大模型接了 RAG,但老板担心会出安全事故,怎么办?”
  • “如果用户给模型输入不合规内容,模型会不会出事?”
  • “我们想做一个 To C 的模型应用,怎么通过备案?”
  • “我们接了行业私有数据,怎么保证模型不会把客户数据拿去训练?”
  • “听说很多提示词被泄露后会被滥用,怎么保护好这些 Prompt?”
  • “提示词过滤器如何设计?”
  • ……

为此,我们邀请了赵帅老师开设这门《大模型安全实战课》,分享这些年在实际项目中经历过的坑、踩过的雷,以及摸索总结出来的一套系统化的做法。帮助你从理论到实践,真正建立起一整套可落地的安全思路、技术手段和架构策略,让安全原则不仅仅停留在概念上,而是能在 AI 产品和平台设计中变成可执行的方案、可操作的流程,帮你打通真正的安全落地路线。

课程的知识导图如下。

模块设计

为了提升你的模型安全认知水平和实战落地能力,课程里一共设计了四个模块。

启航篇:对大模型安全建设建立系统、科学认知。认识大模型安全的本质与价值,模型的运行机制,识别高频的风险类型,了解大模型安全架构逻辑。

风险篇:针对大模型的高频风险,和你深入探讨“大模型被欺骗”(提示注入、上下文劫持、微调投毒等问题)“大模型被盗窃”(逆向攻击)“大模型说错话”(内容越界、隐私泄露)等诸多现实落地风险的判别和预防,帮你稳步提升“风险识别能力”。

防御篇:在深入理解风险的基础上,学习大模型安全的应对策略,掌握如何通过系统性设计手段构建大模型的“安全防线”。围绕“输入 - 处理 - 输出”这一工作流程,我们将学习包括 Prompt 过滤、上下文权限隔离、内容输出拦截与标识、审计日志回溯等在内的核心机制,同时进一步引入如 RLHF(强化学习人类反馈)、宪法式 AI、红队测试、系统提示对齐等业界主流安全机制。

企业篇:将安全从“原理”与“机制”层面,进一步推进到“场景实践”的维度。我们将结合真实案例来加强自己的“安全落地工程”的实战能力。这一章精选了多个代表性的具体业务场景,让你掌握如何在具体产品(聊天类助手、编程类助手、教育、金融、医疗、政务等行业智能体)中实现“因地制宜”的模型安全控制。

课程目录

查看更多
免费试读

适合人群

订阅须知

  1. 订阅成功后,推荐通过“极客时间”App 端、Web 端学习。
  2. 本专栏为虚拟商品,交付形式为图文 + 音频,一经订阅,概不退款。
  3. 订阅后分享海报,每邀一位好友订阅有现金返现。
  4. 戳此先充值再购课更划算,还有最新课表、超值赠品福利。
  5. 企业采购推荐使用“极客时间企业版”便捷安排员工学习计划,掌握团队学习仪表盘。
  6. 戳此申请学生认证,订阅课程享受原价 5 折优惠。
  7. 价格说明:划线价、订阅价为商品或服务的参考价,并非原价,该价格仅供参考。未划线价格为商品或服务的实时标价,具体成交价格根据商品或服务参加优惠活动,或使用优惠券、礼券、赠币等不同情形发生变化,最终实际成交价格以订单结算页价格为准。
讲师

赵帅

前极氪汽车资深算法专家

曾作为 NLP 负责人在知识图谱、智能对话系统、强化学习和大语言模型相关项目中均实现从 0 到 1 的算法研发及工程部署。包括自研 KrGPT 的数据筹备,英伟达芯片及高通芯片的算力评估及测试、模型的 pre-training 和 post-training,模型性能评估...查看更多
看过的人还看了
大厂广告产品心法
郭谊
前阿里资深广告产品业务负责人(P8)

24讲 | 5484 人已学习

¥59¥99
MySQL 运维实战课
张新铭(俊达)
云掣科技资深数据库专家,前淘宝网、支付宝数据库专家

53讲 | 1940 人已学习

¥59¥129
快速上手 Kotlin 开发
张涛
“开源实验室”博主,资深 Android 开发工程师

50讲 | 23334 人已学习

¥59¥129
黄勇的 OKR 实战笔记
黄勇
OKR 实践者与布道师,畅销书《架构探险》作者,TGO 鲲鹏会会员

42讲 | 18911 人已学习

¥59¥129
攻克视频技术
李江
声网 Agora 视频专家

19讲 | 8121 人已学习

¥59¥99
Go 语言项目开发实战
孔令飞
前腾讯云专家工程师

61讲 | 43543 人已学习

¥68¥199