欢迎回来!上一节课,我们给 XiaoPaw 建立了文件系统记忆:Agent 能主动把用户偏好写进 user.md,把自己的行为规范追加到 agent.md,还能按需加载主题文件,把 Bootstrap 的注意力预算用在刀刃上。20 课解决了"写"的问题——记忆有了写通道,不再是工程师手动维护的静态文件。
但停下来想一个问题:这套文件系统能撑多久?
假设 XiaoPaw 陪伴晓寒工作三个月,积累了大量对话记忆。memory.md 的 200 行硬上限早就撑破了,主题文件越来越多 rap 加载时间越来越长。某天晓寒问:“我上次让你帮我查的那个向量数据库对比,结论是什么来着?”——文件索引里有"向量数据库"这个关键词,但"上次那个"指的是哪次?三个月前的哪个 session?文件系统没有答案。

这就是文件索引的天花板:数据量小时够用,数据量大时必然走向搜索。 本课我们就来解决这个问题:用搜索驱动的记忆系统,让 XiaoPaw 拥有无上限的长期记忆。
很多人第一次听到 RAG(Retrieval-Augmented Generation,检索增强生成),脑子里浮现的画面是:向量数据库、embedding、余弦相似度……这个印象没错,但不完整。
