Về Chương 6
Quy Trình ETL Dữ Liệu

QUY TRÌNH TRÍCH XUẤT, BIẾN ĐỔI, NẠP

Lọc và chuẩn hóa luồng dữ liệu thô vào Kho lưu trữ để bảo vệ kết quả báo cáo kinh doanh.

NGUỒN THÔ
1. TRÍCH XUẤT (Extract)
BUỒN BIẾN ĐỔI
2. BIẾN ĐỔI (Transform)
KHO DỮ LIỆU
3. NẠP (Load)
⚙️ HỆ THỐNG ĐÃ SẴN SÀNG: Bật các bộ lọc ở bảng bên phải và nhấn Chạy ETL.

⚙️ BỘ LỌC BIẾN ĐỔI

Lọc Giá Trị Rỗng (Null)Loại bỏ hoặc điền khuyết thiếu
Chuẩn Hóa Ngày ThángQuy đổi mọi định dạng về YYYY-MM-DD
Loại Trùng LặpTriệt tiêu các record lặp chéo

CHỈ SỐ CHẤT LƯỢNG KHO

💎 Sạch (Clean)
0
👾 Rác (Messy)
0
📊 TỶ LỆ LỖI GIGO RATE %Target 0%
0%

TRỌNG TÂM LÝ THUYẾT

Mọi quyết định phân tích dữ liệu lớn đều phải đối mặt với quy luật GIGO (Garbage In, Garbage Out). Nếu khâu biến đổi (Transform) không được đầu tư các bộ lọc tự động chính xác, dữ liệu rác sẽ nạp trực tiếp vào Kho dữ liệu, vô hiệu hóa hoàn toàn độ chính xác của mọi báo cáo BI phía sau.