Regression (回歸)
回歸問題屬於 Supervised Learning (監督式學習),核心是預測「連續數值」。
目標與輸出
- 目標:學到一個函數,讓輸入特徵 x 對應到連續輸出 y
- 常見任務:房價預測、需求預測、溫度預測
- 輸出型態:單一數值或多個連續數值
常見方法
- 線性回歸(Linear Regression):可解釋性高,常作為基線模型
- 決策樹回歸(Decision Tree Regressor):可處理非線性關係
- 隨機森林回歸(Random Forest Regressor):降低單棵樹過擬合風險
- XGBoost Regressor:在結構化資料上常有強表現
- 神經網路:適合特徵複雜或資料量大的情境
評估方式
- Mean Square Error, MSE (均方誤差):對大誤差敏感
- Mean Absolute Error, MAE (平均絕對誤差):對離群值較穩健
- Root Mean Square Error, RMSE (均方根誤差):與原始單位一致,易解讀
- R²(決定係數):衡量模型解釋變異的比例
與分類差異
- 回歸:預測連續值(例如 23.5)
- 分類:預測類別(例如 A 類、B 類)
- 若目標是類別,請看 Classfication (分類)
小例子
- 輸入:坪數、屋齡、地段
- 輸出:房價(連續數值)
- 這是典型回歸問題