ETL, Extract, Transform and Load

ETL 是一種資料整合流程,代表:

它的核心目的是:
把來自不同來源的原始資料整理成可分析、可查詢、可支援商業決策的形式。

ETL 是資料倉儲(data warehouse)、報表分析與 BI 系統常見的基礎流程。

Pasted image 20260111142929.png


三個核心步驟

階段 意義
Extract 從資料來源擷取資料
Transform 清理、轉換、整合資料
Load 載入資料到目標系統

1. Extract(擷取)

Extract 是先把資料從來源系統抓出來。

資料來源可能包括:

常見擷取方式:

全量擷取

增量擷取

常見增量方式:


2. Transform(轉換)

Transform 是 ETL 中最關鍵,也往往最耗時的階段。
目的是把原始資料整理成一致、乾淨、可用的形式。

常見工作包括:

這一步的目標是提升資料的:


3. Load(載入)

Load 是把處理好的資料載入到目標系統。

常見目標包括:

載入後,資料才能被:


ETL 與 ELT 的差異

ETL 和 ELT 都是資料整合方法,差異主要在於:

資料轉換發生在載入前還是載入後

方法 流程 特點
ETL Extract -> Transform -> Load 先整理好再載入
ELT Extract -> Load -> Transform 先載入原始資料,再在目標系統內轉換

ETL and ELT.png


Data Lake 與 Data Warehouse

在 ETL / ELT 脈絡中,常見兩種目標:

簡化理解:


為什麼 ETL 重要

ETL 的價值在於:

如果沒有 ETL,組織通常會面臨:


小結

Summary

ETL 是資料整合的標準流程:

  • Extract:把資料取出
  • Transform:把資料清理、整理、轉換
  • Load:把資料載入目標系統

它的核心目的,是把原始資料轉成可分析、可決策、可被 BI / ML 使用的資料資產。


參考資料:
什麼是 ETL?| Google Cloud
fanruan.com/zh-tw/blog/what-is-ETL

Powered by Forestry.md