課程簡介
Google Colab和Apache Spark簡介
- Google Colab概述
- Apache Spark簡介
- 在Google Colab中設置Spark
使用Apache Spark進行數據處理
- 使用RDD和DataFrame
- 加載和處理大型數據集
- 使用Spark SQL查詢結構化數據
使用Spark進行高級分析
- 使用Spark MLlib進行機器學習
- 進行即時數據分析
- 使用Spark進行分佈式計算
在Google Colab中進行可視化和協作
- 將Colab與流行的可視化庫集成
- 使用Colab筆記本進行協作工作流
- 共享和導出結果
優化大數據工作流
- 調優Spark以提高性能
- 優化內存和存儲使用
- 爲大型數據集擴展工作流
雲中的大數據
- 將Google Colab與基於雲的工具集成
- 使用雲存儲處理大數據
- 在分佈式雲環境中使用Spark
案例研究與最佳實踐
- 回顧實際的大數據應用
- 使用Apache Spark和Colab的案例研究
- 大數據分析的最佳實踐
總結與下一步
最低要求
- 具備數據科學概念的基礎知識。
- 熟悉Apache Spark。
- 具備Python編程技能。
受衆
- 數據科學家。
- 數據工程師。
- 從事大數據研究的人員。
客戶評論 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
課程 - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
課程 - QGIS for Geographic Information System
我喜歡 Pablo 的風格,他涵蓋了很多主題,從報告設計、html 定製到實現簡單的 ML 演算法。Good 平衡理論資訊/練習。Pablo 真的涵蓋了我感興趣的所有主題,並全面回答了我的問題。
Cristian Tudose - SC Automobile Dacia SA
課程 - Advanced Data Analysis with TIBCO Spotfire
機器翻譯
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
課程 - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location