課程簡介

介紹

資料存取方法概述(Hive、資料庫等)

Spark 功能和體系結構概述

安裝和配置 Spark

瞭解 Spark 中的數據幀

定義表和導入數據集

使用 SQL 查詢數據框

執行聚合、JOIN 和嵌套查詢

上傳和 Accessing 數據

查詢不同類型的數據

  • JSON、Parquet 等

使用 SQL 查詢數據湖

故障排除

總結和結論

最低要求

  • 具有 SQL 查詢的經驗
  • 任何語言的程式設計經驗

觀眾

  • 數據分析師
  • 數據科學家
  • 數據工程師
 7 時間:

客戶評論 (5)

相關課程

Python and Spark for Big Data (PySpark)

21 時間:

Introduction to Graph Computing

28 時間:

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 時間:

Apache Spark MLlib

35 時間:

Big Data Analytics in Health

21 時間:

Hadoop and Spark for Administrators

35 時間:

Hortonworks Data Platform (HDP) for Administrators

21 時間:

A Practical Introduction to Stream Processing

21 時間:

Magellan: Geospatial Analytics on Spark

14 時間:

Apache Spark for .NET Developers

21 時間:

SMACK Stack for Data Science

14 時間:

Apache Spark Fundamentals

21 時間:

Administration of Apache Spark

35 時間:

Apache Spark in the Cloud

21 時間:

Spark for Developers

21 時間:

課程分類