作者回复: 对于RAG来说,朴素的构建pipeline已经过于简单,当前的RAG是一个复杂的系统,小模型负责在pipeline中完善各个环节,包括改善Chunking的结果,完善数据抽取,针对Chunking后的数据加Tag用来改进搜索精度, 查询意图,知识图谱构建,等等这些环节,都会需要各种模型介入。 这些地方,有的也可以依赖大模型构建,例如知识图谱等,但由于成本的因素等,最终还是要落实到小模型来处理这些任务,这样可以大大降低成本