Supervised Learning (監督式學習)
The goal of supervised learning is to learn a function that,
given a sample of data and desired outputs, best approximates the relationship between input and output observable in the data.
回歸、分類
監督式學習最常處理的兩個問題:迴歸、分類

| 模型 | 任務 |
|---|---|
| Logistic Regression | 二元分類 + 機率輸出 |
| SVM | 邊界分類 |
| Decision Tree | 規則分類 |
| KNN | 依鄰近樣本分類 |
監督式學習常見的兩大問題類型:
-
- 目標:預測「連續數值」
- 輸入:特徵向量 x
- 輸出:數值 y(可以是小數)
- 常用方法:線性迴歸、隨機森林、XGBoost、神經網路
- 評估方式:MSE、MAE、R²
-
- 目標:預測「離散類別」
- 輸入:特徵向量 x
- 輸出:類別或機率分佈
- 類型:
- 二元分類:兩種結果(是/否)
- 多類分類:多個互斥結果(貓/狗/鳥)
- 多標籤分類:可同時屬於多個結果(搖滾 & 抒情)
- 常用方法:邏輯斯迴歸、決策樹、隨機森林、XGBoost、神經網路
- 評估方式:Accuracy、Precision、Recall、F1、AUC
- 常用輸出函數:
- 二元:Sigmoid
- 多類:Softmax
典型流程
- 問題定義:確認目標是預測數值(回歸)還是類別(分類)
- 資料切分:Train / Validation / Test
- 模型訓練:用訓練集學習參數
- 模型評估:用驗證集或測試集評估指標
- 調整優化:調整特徵、模型與超參數
如何快速判斷用回歸還是分類
- 目標欄位是連續數值(例如房價、溫度)-> 用 Regression (回歸)
- 目標欄位是離散類別(例如垃圾郵件/非垃圾郵件)-> 用 Classfication (分類)
分類與回歸的差異?
Regression 預測連續數值;Classification 預測類別(可輸出機率分佈向量)
