課程簡介

  • 第 1 部分:Big Data 和 NoSQL 簡介
    • Big Data 生態系統
    • NoSQL 概述
    • CAP定理
    • 何時 NoSQL 合適
    • 列式存儲
    • HBase 和 NoSQL
  • 第2部分:HBase 介紹
    • 概念和設計
    • 體系結構(HMaster 和區域伺服器)
    • 數據完整性
    • HBase 生態系統
    • 實驗室:探索 HBase
  • 第3部分:HBase 數據模型
    • 命名空間、表和區域
    • 行、列、列族、版本
    • HBase Shell 和管理命令
    • 實驗室 : HBase Shell
  • 第 3 部分:Access使用 Java API 處理 HBase
    • Java API 簡介
    • 讀/寫路徑
    • 時序數據
    • 掃描
    • Map Reduce(地圖縮減)
    • 過濾器
    • 計數器
    • 協處理器
    • 實驗室(多個):使用 HBase Java API 實現  時間序列、Map Reduce、過濾器和計數器。
  • 第 4 部分:HBase 模式設計:小組會議
    • 向學生展示真實世界的用例
    • 學生分組提出設計解決方案
    • 討論/批評並從多種設計中學習
    • 實驗室:在 HBase 中實現方案
  • 第 5 部分:HBase 內部結構
    • 瞭解 HBase 的底層
    • Memfile / HFile / WAL
    • HDFS 存儲
    • 壓實
    • 分裂
    • 泛光濾鏡
    • 緩存
    • 診斷
  • 第 6 部分:HBase 安裝和配置
    • 硬體選型
    • Install 方法
    • 常用配置
    • 實驗室:安裝 HBase
  • 第 7 部分:HBase 生態系統
    • 使用 HBase 開發應用程式
    • 與其他 Hadoop 堆棧交互(MapReduce、Pig、Hive)
    • 圍繞 HBase 的框架
    • 進階概念(協處理器)
    • 實驗室:編寫 HBase 應用程式
  • 第 8 部分:監控和最佳實踐
    • 監測工具和做法
    • 優化 HBase
    • 雲中的 HBase
    • HBase 的真實用例
    • 實驗室:檢查 HBase 生命體征

最低要求

  • 熟悉Java程式設計語言
  • 熟悉 Java 程式設計語言(導航Linux 命令行,使用 vi / nano 編輯檔)
  • 像 Eclipse 或 IntelliJ 這樣的 Java IDE

實驗室環境:

將為學生提供一個有效的 HBase 集群。學生需要一個SSH用戶端和一個瀏覽器來訪問集群。

零安裝:無需在學生機器上安裝HBase軟體!

 21 時間:

客戶評論 (5)

相關課程

NoSQL Database with Microsoft Azure Cosmos DB

14 時間:

Hortonworks Data Platform (HDP) for Administrators

21 時間:

Apache Ambari: Efficiently Manage Hadoop Clusters

21 時間:

Impala for Business Intelligence

21 時間:

Data Analysis with Hive/HiveQL

7 時間:

Big Data Storage Solution - NoSQL

14 時間:

Big Data & Database Systems Fundamentals

14 時間:

MemSQL

28 時間:

A Practical Introduction to NoSQL Databases

28 時間:

OrientDB for Developers

14 時間:

Redis for High Availability and Performance Training Course

21 時間:

Scylla Database

21 時間:

Administrator Training for Apache Hadoop

35 時間:

Big Data Analytics in Health

21 時間:

Datameer for Data Analysts

14 時間:

課程分類

1