聯繫我們

課程簡介

大數據生態系統入門

  • 大數據技術與架構概覽。
  • 批次處理與實時處理之比較。
  • 支持擴展性的數據存儲策略。

使用 Apache Spark 進行高級數據處理

  • 優化 Spark 作業以提升效能。
  • 進階轉換與動作操作。
  • 處理結構化串流數據。

大規模機器學習

  • 分散式模型訓練技術。
  • 在大型數據集上進行超參數調優。
  • 在大數據環境中部署模型。

用於大數據的深度學習

  • 將 TensorFlow 和 PyTorch 與 Spark 整合。
  • 分散式深度學習訓練流程。
  • 在圖像、文本及時間序列分析中的應用案例。

實時分析與數據串流

  • 使用 Apache Kafka 進行串流數據採集。
  • 串流處理框架。
  • 實時系統中的監控與告警機制。

數據治理、安全與倫理

  • 數據隱私與合規性要求。
  • 大數據系統中的存取控制與加密。
  • 大規模分析中的倫理考量。

將大數據整合至商業智慧

  • 針對大數據的數據視覺化與儀表板製作。
  • 將大數據流程連接至商業智慧工具。
  • 透過高級分析推動業務成果。

總結與後續步驟

最低要求

  • 具備扎實的數據分析與統計建模概念理解。
  • 具有使用 Python、R 或 Scala 等數據處理工具和編程語言的經驗。
  • 熟悉 Hadoop 或 Spark 等分散式計算框架。

受眾對象

  • 旨在掌握大規模數據處理與預測分析的數據科學家。
  • 尋求設計並實施高級分析工作流的高階分析師。
  • 專注於創新數據驅動解決方案的研究與開發專業人員。
 42 小時

客戶評論 (2)

課程分類