Softmax
用處
-
將多維輸出(logits)轉成加總為 1 的機率分布
-
適用於多類別分類(multi-class classification)模型的最後一層
公式
對輸入向量

為什麼選 Softmax 而不是 Sigmoid?
- Sigmoid 適用於二元分類,輸出單一機率(另一類為 1−p)
- Softmax 是 Sigmoid 的多類延伸,能將 logits 正規化為機率分布,適合多類情境
* 若為 多標籤(multi-label)分類,較適合對每個類別分別使用 Sigmoid
