RAG 的目标是“可追溯”。当用户能看到来源、能理解为什么这么回答,他对结果的信任会显著提升。真正影响体验的不是“库有多大”,而是检索质量、引用呈现与错误兜底。
三件事让 RAG 变得可信
- 分段与清洗:把文档切到可检索的粒度,去掉噪音
- 引用展示:回答里附带来源片段(必要时可跳转)
- 失败兜底:检索不到就明确说“找不到”,给出下一步建议
分段的经验法:别让 chunk 变成摘要
- 以“问题能被回答”为粒度切:FAQ、步骤、条款、定义
- 保留标题与层级:让检索结果自带上下文
- 去噪:目录、页眉页脚、重复水印会污染召回
引用怎么展示,用户才会看
- 给“证据”而不是给链接:展示 1–3 句原文片段
- 一条结论对应一条引用:别把所有引用堆到末尾
- 允许展开/跳转:对关键场景提供“查看原文”
失败兜底比“硬编”重要
- 明确说找不到:不要编造不存在的来源
- 给下一步:建议用户上传资料/换关键词/选择分类
- 记录缺口:把“搜不到的问题”变成下一轮知识更新清单