Softmax

用處

公式

對輸入向量 z=(z1,z2,,zK),Softmax 的表達為:

σ(z)i=ezij=1Kezj

Softmax Function.png


為什麼選 Softmax 而不是 Sigmoid?

  • Sigmoid 適用於二元分類,輸出單一機率(另一類為 1−p)
  • Softmax 是 Sigmoid 的多類延伸,能將 logits 正規化為機率分布,適合多類情境

* 若為 多標籤(multi-label)分類,較適合對每個類別分別使用 Sigmoid

一個「擲骰子」的比喻,讓你輕鬆搞懂 AI 如何做選擇 (Softmax 原理) – 李彼德之家

Powered by Forestry.md