2026/6/24 10:17:07

RAG搭建-切片召回评测与选型

RAG搭建-切片召回评测与选型 文章目录RAG 先别急着上模型切片怎么做召回怎么搭评测怎么做选型建议结论RAG 先别急着上模型很多 RAG 项目失败不是模型不行而是前面的数据处理没做好。文档清洗、切片、召回、重排、评测这几步决定了大部分效果。切片怎么做切片不是越短越好也不是越长越好。比较稳的思路是按语义结构切再加少量 overlap。标题、段落、代码块尽量保留边界表格和列表别硬拆过短会丢上下文过长会稀释重点召回怎么搭常见做法是三路一起上向量检索找语义相近的内容关键词检索补精确匹配知识图谱补关系和多跳信息最后再用 RRF 或 rerank 做融合效果通常比只靠单路稳定。评测怎么做别只看“回答像不像”。检索阶段要看 RecallK、MRR、NDCG、HitRate生成阶段要看 Faithfulness、Answer Relevancy、Context Precision、Context Recall。选型建议文档量不大先把清洗和切片做扎实检索效果不稳就上 hybrid生成结果容易胡说就加重排和上下文约束结论RAG 的本质不是“接一个向量库”而是把知识处理成能被稳定检索、稳定回答的工程链路。