Self-RAG

Self-RAG 是基於 RAG, Retrieval-Augmented Generation
其核心在於 自我反思與適應性檢索生成機制,旨在提升大型語言模型(LLM)的 事實性、相關性與生成質量


RAG:
向量檢索外部知識庫來彌補 LLM 內部知識的不足,提高回答準確度

Self-RAG:
不僅檢索知識,還讓模型能 判斷是否需要檢索、評估檢索結果的相關性、反思自我生成的內容,在生成過程中加入自我評估機制。

Pasted image 20260105223101.png

Self-RAG 光是用向量資料庫語意檢索不夠精準啦!來點自我批評吧


特性

  1. 按需檢索(On-Demand Retrieval)
    根據當前輸入動態決定是否檢索以及檢索多少次
  2. Reflection Tokens(反思標記)
    • 判斷是否需要進行檢索
    • 評估檢索結果與生成內容的真實性與相關性
    • 控制後續生成流程
      這使得檢索與生成過程具備可控性與互為反饋
  3. 自我評估與批判(Self-Reflection)
    對初次生成結果進行自我檢查,如識別可能的錯誤或缺乏支持的陳述,並根據結果選擇是否再執行檢索、增強回答。

Pasted image 20260105231907.png

SELF-RAG: 自我反思检索增强生成,提升语言模型生成质量与准确性


Powered by Forestry.md