課程簡介

數據倉庫基礎

  • 倉庫的目的、組件和架構
  • 數據集市、企業倉庫和數據湖模式
  • OLTP與OLAP基礎知識及工作負載分離

維度建模

  • 事實、維度和粒度
  • 星型模式與雪花模式
  • 緩慢變化維度的類型和處理方法

ETL和ELT流程

  • 從OLTP和API中提取數據的策略
  • 數據轉換、清洗和一致性處理
  • 加載模式、編排和依賴管理

數據質量與元數據管理

  • 數據剖析和驗證規則
  • 主數據和參考數據的對齊
  • 數據血緣、目錄和文檔管理

分析與性能

  • 立方體概念、聚合和物化視圖
  • 分區、聚類和索引以優化分析
  • 工作負載管理、緩存和查詢調優

安全與治理

  • 訪問控制、角色和行級安全
  • 合規性考慮和審計
  • 備份、恢復和可靠性實踐

現代架構

  • 雲數據倉庫和彈性擴展
  • 流式數據攝入和近即時分析
  • 成本優化和監控

結業項目:從源數據到星型模式

  • 將業務流程建模爲事實和維度
  • 構建端到端的ETL或ELT工作流
  • 發佈儀表板並驗證指標

總結與下一步

最低要求

  • 瞭解關係數據庫和SQL
  • 具備數據分析或報告經驗
  • 對雲端或本地數據平臺有基本瞭解

目標受衆

  • 從數據分析師轉型爲數據倉庫專業人員
  • BI開發人員和ETL工程師
  • 數據架構師和團隊負責人
 35 時間:

客戶評論 (5)

課程分類