Greenplum 架構與資料建模培訓

(1 客戶評論)

Greenplum 是一個開源的極大規模平行處理 (MPP) 資料平台，專為分析與大規模資料環境而設計。

本課程由講師親自指導，提供線上或線下培訓選項，主要對象為希望了解 Greenplum 內部架構、建立最佳化資料模型，並應用高效能 SQL 於分散式環境中的初級至中高級技術使用者。

完成本培訓後，學員將能夠：

理解 Greenplum 的無共享 (shared-nothing) 架構與平行處理模型。
設計針對查詢效能最佳化的分散式資料表結構與分區。
運用索引策略、儲存格式與實體設計技術。
解讀 EXPLAIN 計畫，並依據最佳實務進行查詢最佳化。

課程形式

互動式講授與討論。
大量練習與實作。
在即時實驗室環境中進行的實務操作。

課程客製化選項

如需本課程的客製化培訓，請聯繫我們安排。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

Greenplum 架構

平行處理與對稱多處理 (SMP)。
Segment 角色與叢集配置。
可擴展性與資料移動。
Greenplum 資料倉儲架構。

Greenplum 資料表結構

分散式資料表與隨機指派資料表。
Heap 資料表與僅追加 (append-only) 資料表。
列儲存格式與行儲存格式。
分區資料表與叢集資料表。

資料分佈與雜湊

雜湊邏輯與分佈金鑰。
偏斜 (Skew) 處理與效能影響。
雜湊映射與資料配置策略。

索引與效能最佳化

叢集索引與非叢集索引。
B-tree 與 bitmap 索引的使用案例。
索引掃描與儲存行為。

實體資料庫設計

正規化與邏輯模型設計。
使用者存取策略與分佈分析。
資料特性和索引決策。

反正規化技術

衍生資料、摘要表與預先聯結 (pre-joins)。
將列儲存資料表作為垂直分區。
資料集市 (Data Marts) 與實體化檢視。

進階 SQL 與查詢執行

聯結策略與資料再分佈。
OLAP 與視窗函數。
臨時表、子查詢與衍生表。

EXPLAIN 計畫與查詢調校

閱讀與解讀 EXPLAIN 輸出。
成本分析與計畫最佳化。
聯結移動與 Segment 本地操作。

Greenplum 工具與最佳實務

ANALYZE 與 VACUUM。
使用 Nexus 進行資料載入與移動。
安全性、權限與效能建議。

總結與下一步

最低要求

具備關聯式資料庫與 SQL 的知識。
擁有資料倉儲或分析系統的經驗。
熟悉 Linux 命令列操作。

目標受眾

資料架構師與工程師。
資料庫管理員與技術主管。
使用 Greenplum 的 BI 開發人員與分析專家。

21 小時

需要幫助選擇合適的課程嗎？
macao@nobleprog.com 或 +852 81990613

客戶評論 (1)

實踐

Liliana Padilla - Hipodromo de Agua Caliente

課程 - Greenplum Architecture and Data Modeling

機器翻譯

Greenplum 架構與資料建模培訓

課程簡介

最低要求

客戶評論 (1)

Liliana Padilla - Hipodromo de Agua Caliente

課程 - Greenplum Architecture and Data Modeling

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Greenplum 架構與資料建模培訓

課程簡介

最低要求

客戶評論 (1)

Liliana Padilla - Hipodromo de Agua Caliente

課程 - Greenplum Architecture and Data Modeling

相關課程

進階 Apache Iceberg

Apache Iceberg 基礎知識

使用 Google Colab 和 Apache Spark 進行大數據分析

Big Data Business Intelligence for Govt. Agencies

數據分析與大數據實用指南 - 3天

大數據與高級分析

Apache NiFi for Administrators

PySpark 與機器學習

Apache Spark基礎

管理 Apache Spark

雲端中的 Apache Spark

Python 與 Spark 用於大數據分析 (PySpark)

Python、Spark 和 Hadoop 用於大數據

Stratio：具備 Rocket 與 Intelligence 模組的 PySpark

課程分類

大數據

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites