課程簡介

Apache Spark 簡介

  • Spark在大數據處理中的作用
  • Spark體系結構及其元件

設定Apache Spark

  • 硬體和軟體要求
  • 單機模式和集群模式的安裝過程
  • 面向系統管理員的配置最佳實踐

管理 Spark 群集

  • 群集管理工具和技術
  • 監視 Spark 應用程式和群集資源
  • 安全配置和使用者管理

性能調優和優化

  • 資源分配和調度
  • 調整 Spark 以獲得最佳性能
  • 識別和解決常見瓶頸

故障排除和問題解決

  • 常見的Spark管理挑戰
  • 用於故障排除的診斷工具和技術
  • 解決常見問題的分步方法
  • 維護正常運行的 Spark 環境的最佳做法

高級管理主題

  • 與其他大數據工具集成
  • 確保高可用性和災難恢復
  • 升級和擴展 Spark 群集

摘要和後續步驟

最低要求

  • 網路配置和管理的基本知識
  • 熟悉 Linux 操作系統和命令行介面
  • 有興趣學習分散式計算系統和大數據管理

觀眾

  • 系統管理員
 35 時間:

客戶評論 (5)

相關課程

Python and Spark for Big Data (PySpark)

21 時間:

Introduction to Graph Computing

28 時間:

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 時間:

Apache Spark MLlib

35 時間:

Big Data Analytics in Health

21 時間:

Hadoop and Spark for Administrators

35 時間:

Hortonworks Data Platform (HDP) for Administrators

21 時間:

A Practical Introduction to Stream Processing

21 時間:

Magellan: Geospatial Analytics on Spark

14 時間:

Apache Spark for .NET Developers

21 時間:

SMACK Stack for Data Science

14 時間:

Apache Spark Fundamentals

21 時間:

Apache Spark in the Cloud

21 時間:

Spark for Developers

21 時間:

Scaling Data Pipelines with Spark NLP

14 時間:

課程分類