Classfication (分類)

分類問題屬於 Supervised Learning (監督式學習)
又可以分為二元分類 (Binary) 及多分類 (Multi-Class)

二元分類：輸出只有兩種標籤（例如：垃圾郵件 / 非垃圾郵件）。
多分類：輸出有三種或以上標籤（例如：動物圖片辨識：貓 / 狗 / 鳥）。

激活函數

使用的 Activation Function（激活函數）主要是 Softmax

將輸出值轉換為概率分佈，方便進行分類決策
將輸出值限制在 [0, 1] 之間，且 $\sum_{i} y_{i}^{'} = 1$
在二元分類中常使用 Sigmoid 作為輸出層激活函數

評估

Confusion Matrix (混淆矩陣) 為衡量分類模型效能的方法之一

橫軸：預測結果 (Predicted)
縱軸：真實標籤 (Actual)
可計算多種評估指標（Precision、Recall、F1-score 等）

Confusion Matrix.png

方法

根據不同的模型樣貌，其在分類問題中能夠得到不同的效能表現，常見的模型種類有：

邏輯回歸 Logistic Regression：線性分類模型，適合線性可分的數據
K-近鄰演算法 Nearest Neighbors Algorithm：基於距離度量的非參數方法
Support Vector Machine (SVM, 支持向量機)：尋找最大間隔的超平面，支援 kernel trick 處理非線性資料
決策樹分類 (Decision Tree Classification)：基於特徵條件分裂節點的樹狀模型
隨機森林分類 (Random Forest Classification)：多棵決策樹組成的集成方法，有效降低過擬合

Loss of Classification

（分類任務的損失函數）

在分類問題中，最常用的損失函數是 Cross-Entropy Loss（交叉熵損失）

「最小化交叉熵」＝ Maximizing Likelihood (最大化似然)
簡單理解：讓模型預測的機率分佈，盡量貼近真實標籤的分佈
- 最大似然：用「最大化機率」的說法來看問題
- 最小化交叉熵：用「最小化誤差」的說法來看問題

如何選擇 MSE 或 Cross-Entropy？

雖然 MSE（均方誤差） 和 Cross-Entropy 都可以用來做分類，但在梯度下降的表現上差異很大：

在分類問題中，Cross-Entropy 的損失曲面更平滑且斜率明顯
MSE 在接近飽和區（Sigmoid 輸出接近 0 或 1）時，梯度幾乎為 0，容易讓 Gradient Descent 陷入停滯（stuck）
因此，多數分類任務會選擇 Cross-Entropy Loss

Tip

MSE：適合迴歸問題或輸出為連續值的情況
Cross-Entropy：更適合分類任務，尤其是配合 Sigmoid（Binary）或 Softmax（Multi-Class）輸出層時

回歸與分類

Powered by Forestry.md