Data Modeling Chuẩn Star Schema – Bí Quyết Dashboard Chạy Nhanh, Số Liệu Chính Xác
Bạn có bao giờ gặp cảnh dashboard chạy cực chậm, số liệu double count hoặc DAX trả kết quả sai? 💡 Phần lớn nguyên nhân nằm ở data model. Hãy cùng tìm hiểu Star Schema – mô hình dữ liệu chuẩn giúp bạn giải quyết các vấn đề này.
Nội dung bài viết
Star Schema Là Gì?
Star Schema là mô hình dữ liệu dạng “hình ngôi sao” gồm:
- 1 bảng Fact ở trung tâm (chứa số liệu giao dịch: doanh thu, số lượng, cost)
- N bảng Dimension xung quanh (chứa thông tin mô tả: sản phẩm, khách hàng, thời gian)
📌 Hình dung:
Dim_Product
|
Dim_Date — Fact_Sales — Dim_Customer
|
Dim_Region
Fact = trung tâm, Dimension = các “cánh sao”.
Vì Sao Nên Dùng Star Schema?
✅ Hiệu năng cao: dashboard load nhanh hơn Snowflake schema
✅ Tránh double-count: rõ ràng quan hệ 1–nhiều
✅ Dễ viết DAX: CALCULATE, TOTALYTD hoạt động chính xác
✅ Chuẩn hóa: dễ mở rộng khi có thêm dữ liệu mới
Các Thành Phần Trong Star Schema
3.1 Fact Table
- Chứa số liệu định lượng (Revenue, Quantity, Cost)
- Granularity rõ ràng (ví dụ: 1 dòng = 1 đơn hàng)
- Không nên chứa cột descriptive dài (ProductName)
3.2 Dimension Table
- Chứa cột mô tả, dùng để filter/slicer
- Có khóa chính duy nhất (ProductID, CustomerID)
- Tách riêng bảng Date, Region, Product để dễ join
Quy Trình Xây Dựng Star Schema
1️⃣ Xác định Fact chính: ví dụ Fact_Sales
2️⃣ Xác định Dimension liên quan: Date, Product, Customer
3️⃣ Chuẩn hóa cột khóa: ID phải unique, data type đồng nhất
4️⃣ Tạo relationship: 1–nhiều từ Dimension → Fact
5️⃣ Test DAX: chạy measure đơn giản để check số liệu
📌 Tip: Luôn giữ Cross Filter Direction = Single trừ khi thực sự cần Both.
Lỗi Thường Gặp Khi Không Dùng Star Schema
⚠ Double count: khi join bảng-to-bảng phức tạp
⚠ Hiệu năng kém: quá nhiều bảng lookup lồng nhau
⚠ DAX sai: CALCULATE trả kết quả sai do quan hệ mơ hồ
⚠ Khó maintain: thêm bảng mới → phải viết lại nhiều join
Ví Dụ Thực Tế – Trước & Sau
Trước:
- Bảng bán hàng + bảng khách hàng join trực tiếp trong Power BI
- Dashboard chậm, số khách unique bị nhân đôi
Sau:
- Xây Dim_Customer chuẩn, tạo quan hệ 1–nhiều
- Dashboard load nhanh hơn 3 lần, số liệu chính xác 100%
Checklist Star Schema Cho DA
✅ 1 Fact table rõ granularity
✅ Các Dimension có ID unique
✅ Relationship 1–nhiều, Single direction
✅ Ít calculated column, dùng measure thay thế
✅ Test KPI trước khi publish
Kết Luận
Star Schema không chỉ dành cho Data Engineer – Data Analyst cần nắm vững để:
✅ Làm dashboard chạy mượt, refresh nhanh
✅ Viết DAX dễ hơn, giảm bug
✅ Tạo “một phiên bản sự thật” (SSOT) cho cả công ty
🎓 Khoá “POWER BI ” tại MCI Academy
• Học thiết kế Fact & Dimension chuẩn thực tế
• Thực hành model dữ liệu bán hàng → build dashboard
• Mentor review mô hình & tối ưu performance
📞 Hotline: 0352.433.233
📧 Email: cskh@mcivietnam.com

Các khóa học
- Mastering AWS : From Basics to Applications Specialized
- Data Engineer Track Specialized
- Combo Data Engineering Professional Hot
- AI & DASHBOARD – CHỈ 990K Hot
- Combo Python Level 1 & Level 2 Bestseller
- Business Intelligence Track Hot
- Data Science Track Bestseller
- Data Analyst Professional (Data Analyst with Python Track) Bestseller
- RPA UiPath Nâng Cao: Chiến Thuật Automation Cho Chuyên Gia Specialized
- RPA UiPath cho Người Mới Bắt Đầu: Thành Thạo Automation Chỉ Trong 1 Ngày Specialized
- Business Analyst Fast Track Bestseller
- Business Analyst Bestseller
Đăng ký tư vấn khóa học
*Vui lòng nhập số điện thoại của bạn
*Vui lòng nhập họ tên của bạn
*Vui lòng chọn giới tính
*Vui lòng chọn 1 trường