Self-RAG
Self-RAG 是基於 RAG, Retrieval-Augmented Generation
其核心在於 自我反思與適應性檢索生成機制,旨在提升大型語言模型(LLM)的 事實性、相關性與生成質量
RAG:
向量檢索外部知識庫來彌補 LLM 內部知識的不足,提高回答準確度
Self-RAG:
不僅檢索知識,還讓模型能 判斷是否需要檢索、評估檢索結果的相關性、反思自我生成的內容,在生成過程中加入自我評估機制。

Self-RAG 光是用向量資料庫語意檢索不夠精準啦!來點自我批評吧
特性
- 按需檢索(On-Demand Retrieval)
根據當前輸入動態決定是否檢索以及檢索多少次 - Reflection Tokens(反思標記)
- 判斷是否需要進行檢索
- 評估檢索結果與生成內容的真實性與相關性
- 控制後續生成流程
這使得檢索與生成過程具備可控性與互為反饋
- 自我評估與批判(Self-Reflection)
對初次生成結果進行自我檢查,如識別可能的錯誤或缺乏支持的陳述,並根據結果選擇是否再執行檢索、增強回答。

SELF-RAG: 自我反思检索增强生成,提升语言模型生成质量与准确性