Self-RAG

Self-RAG 是基於 RAG, Retrieval-Augmented Generation
其核心在於自我反思與適應性檢索生成機制，旨在提升大型語言模型（LLM）的事實性、相關性與生成質量

RAG：
向量檢索外部知識庫來彌補 LLM 內部知識的不足，提高回答準確度

Self-RAG：
不僅檢索知識，還讓模型能 判斷是否需要檢索、評估檢索結果的相關性、反思自我生成的內容，在生成過程中加入自我評估機制。

Pasted image 20260105223101.png

特性

按需檢索（On-Demand Retrieval）
根據當前輸入動態決定是否檢索以及檢索多少次
Reflection Tokens（反思標記）
- 判斷是否需要進行檢索
- 評估檢索結果與生成內容的真實性與相關性
- 控制後續生成流程
  這使得檢索與生成過程具備可控性與互為反饋
自我評估與批判（Self-Reflection）
對初次生成結果進行自我檢查，如識別可能的錯誤或缺乏支持的陳述，並根據結果選擇是否再執行檢索、增強回答。

Pasted image 20260105231907.png