04｜安全架构：如何构建一个有边界的大模型系统？

赵帅

你好，我是赵帅。欢迎来到我们课程的第 4 课。
在前几节课中，我们已经聊了大模型是如何工作的，也讲了八类典型的安全风险，明确了风险类型。但你可能发现两个问题，我们讲了这么多漏洞、绕过、注入，但是没有讲怎么防御。此外，这些攻击方式，很多其实都不完全是模型本身的问题，而是跟你怎么用模型、怎么部署模型、怎么设计模型的使用方式密切相关。
这节课，我们就要进入大模型安全架构的主题，带你从整体系统视角思考，如果你是平台方、系统架构师或者模型集成开发者，该如何设计一个“有边界”的安全系统？怎么给模型建围墙、设边界、装护栏，让它在复杂场景中既能发挥能力，又不会误入歧途？
我先说说这节课的节奏安排：我们先从一个比喻开始，说说大模型是怎么“越界”的，然后我们按模型的运行路径，拆解出大模型系统必须经历的三道关键环节，分别对应三个“边界防护点”。最后，我们会带你建立一个系统性的安全架构观，帮助你理解“防在何处、防什么、怎么防”。
模型为什么需要“系统边界”？你可以把大模型理解成一个“天赋异禀但缺乏边界感的助手”。它能回答几乎所有问题，但它不知道“哪些问题不能答”；它能处理各种输入，但也无法判断“哪些输入是不合理的”；它甚至可以用逻辑自洽的方式输出结论，却并不一定判断得出“这些结论是否合法、合规、可用”。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. 大模型系统需要建立系统边界，以规范模型行为，防止误导性内容的生成和输出。 2. 安全架构的核心是三道“防线门槛”，包括输入控制门、上下文控制门和输出审查门。 3. 安全架构的设计应该考虑模型的自由度上限，避免模型在复杂场景中误入歧途。 4. 安全架构的设计需要从整体系统视角思考，包括平台方、系统架构师和模型集成开发者的角度。 5. 大模型系统在每一次请求处理时，必须通过输入控制门、上下文控制门和输出审查门，构成一个有边界的系统。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《大模型安全实战课》，新⼈⾸单¥59

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论