感謝您提交詢問!我們的一位團隊成員將在短時間內與您聯繫。
感謝您提交預訂!我們的一位團隊成員將在短時間內與您聯繫。
課程簡介
數據倉庫基礎
- 倉庫的目的、組件和架構
- 數據集市、企業倉庫和湖倉模式
- OLTP與OLAP基礎及工作負載分離
維度建模
- 事實、維度和粒度
- 星型模式與雪花模式
- 緩慢變化維度的類型及處理
ETL與ELT流程
- 從OLTP和API提取數據的策略
- 轉換、數據清洗和一致性
- 加載模式、編排和依賴管理
數據質量與元數據管理
- 數據剖析和驗證規則
- 主數據和參考數據的對齊
- 數據血緣、目錄和文檔管理
分析與性能
- 立方體概念、聚合和物化視圖
- 分區、聚類和索引以優化分析
- 工作負載管理、緩存和查詢調優
安全與治理
- 訪問控制、角色和行級安全
- 合規性考慮和審計
- 備份、恢復和可靠性實踐
現代架構
- 雲數據倉庫和彈性擴展
- 流式數據攝取和近即時分析
- 成本優化和監控
結業項目:從源數據到星型模式
- 將業務流程建模爲事實和維度
- 構建端到端的ETL或ELT工作流
- 發佈儀表板並驗證指標
總結與下一步
最低要求
- 瞭解關係型數據庫和SQL
- 具備數據分析或報告經驗
- 對雲或本地數據平臺有基本瞭解
受衆
- 從數據分析師轉向數據倉庫的人員
- BI開發人員和ETL工程師
- 數據架構師和團隊負責人
35 時間:
客戶評論 (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
課程 - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
課程 - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
課程 - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
課程 - Apache Spark in the Cloud
practice tasks