Multi-Agent System (MAS)

多個 Agent 互相討論,比一個通常效果更好

What are AI agents?
AI Agent (智慧代理)
透過自主設計與調整本身的工作流程,能夠自主運行,並代替系統、人來執行特定任務

What is a multiagent system?
採用分散式運作:讓多個 AI 代理各自負責不同部分,根據需要進行溝通與協調

What Are AI Agents? | IBM
What is a Multiagent System? | IBM
Multi-Agent System. Multi-Agent systems are LLM… | by A B Vijay Kumar | Medium


Multi-agent architectures

Multi-agent architectures.png

多代理系統的連接方式:

Multi-agent Systems


Decision-making Thought

LLM-MA 系統的架構.png

代理分析 (Agent Profiling)

代理 (agents) 由 特徵 (traits)、行為 (actions)、技能 (skills) 定義,代理在不同環境中扮演不同角色,代理分析方法 (Agent Profiling Methods):

代理溝通 (Agents Communication)

LLM-MA 系統的溝通是 集體智慧 (collective intelligence) 為基礎

溝通範式 (Communication Paradigms)

溝通結構 (Communication Structure)

[2402.01680] Large Language Model based Multi-Agents: A Survey of Progress and Challenges


自我反思 (self-reflection) 方法 讓模型透過自我產生的回饋來改善答案,但存在 思維退化 (Degeneration-of-Thought, DoT) 問題,即當模型對自身答案過於自信時,即便最初答案錯誤,也難以修正。

兩個數據集上驗證了 MAD 方法的有效性:

Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate Framework.png

Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate - ACL Anthology


溝通策略

動機

目前的 LLM 評估方法 (Agent Evaluator) 無法良好地對齊(align)人類標註結果。 如果能模仿人類評估方式,是否能提升效果?

Multi-Agent System (MAS)


Role Specification(角色規範)

不同的角色設定,讓代理(agents)按照人物設定進行討論:

  • Single-Agent:單個代理評估
  • Multi-Agent (Simple Role):多個代理但角色設定相同
  • Multi-Agent (Diverse Role) → ✅ 最佳方法
    • 每個代理具備不同的角色(如批評者、新聞作者、心理學家等),提供多元視角,改善評估準確性。

Communication Strategy(溝通策略)

多代理的不同溝通方式:

  1. One-by-One(逐輪發言) → ✅ 最佳方法

    • 每個代理依序回應,根據前一位的發言調整自身輸出
    • 保持上下文脈絡,避免資訊遺失,連貫的對話過程
    • 確保每個代理基於前一個代理的意見進行推理,提高整體討論的深度與一致性
  2. Simultaneous-Talk(同步討論)

    • 所有代理同時發言,然後互相評論。
    • 缺點:容易導致資訊衝突,影響評估穩定性。
  3. Simultaneous-Talk-with-Summarizer(同步討論+摘要)

    • 額外加入 總結者,幫助整理討論焦點,減少冗長對話。
    • 有助於長文本處理,但可能影響個別代理的獨立判斷。

結論

  • 多代理、多角色設定的評估方式,比單一代理更能對齊人類標註結果。
  • One-by-One(逐輪發言)溝通策略效果最佳,能夠維持資訊連貫性並避免衝突。
  • 透過模仿人類討論方式(不同角色、協商機制),LLM 評估能更接近人類標準。

代理分析 (Agent Profiling)

Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate - ACL Anthology

Reflection Agents


Powered by Forestry.md