Supervised Learning (監督式學習)

The goal of supervised learning is to learn a function that,
given a sample of data and desired outputs, best approximates the relationship between input and output observable in the data.

回歸、分類

監督式學習最常處理的兩個問題：迴歸、分類

模型	任務
Logistic Regression	二元分類 + 機率輸出
SVM	邊界分類
Decision Tree	規則分類
KNN	依鄰近樣本分類

監督式學習常見的兩大問題類型：

Regression (回歸)
- 目標：預測「連續數值」
- 輸入：特徵向量 x
- 輸出：數值 y（可以是小數）
- 常用方法：線性迴歸、隨機森林、XGBoost、神經網路
- 評估方式：MSE、MAE、R²
Classfication (分類)
- 目標：預測「離散類別」
- 輸入：特徵向量 x
- 輸出：類別或機率分佈
- 類型：
  1. 二元分類：兩種結果（是/否）
  2. 多類分類：多個互斥結果（貓/狗/鳥）
  3. 多標籤分類：可同時屬於多個結果（搖滾 & 抒情）
- 常用方法：邏輯斯迴歸、決策樹、隨機森林、XGBoost、神經網路
- 評估方式：Accuracy、Precision、Recall、F1、AUC
- 常用輸出函數：
  - 二元：Sigmoid
  - 多類：Softmax

典型流程

問題定義：確認目標是預測數值（回歸）還是類別（分類）
資料切分：Train / Validation / Test
模型訓練：用訓練集學習參數
模型評估：用驗證集或測試集評估指標
調整優化：調整特徵、模型與超參數

如何快速判斷用回歸還是分類

目標欄位是連續數值（例如房價、溫度）-> 用 Regression (回歸)
目標欄位是離散類別（例如垃圾郵件/非垃圾郵件）-> 用 Classfication (分類)

分類與回歸的差異？

Regression 預測連續數值；Classification 預測類別（可輸出機率分佈向量）