Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
第 1 部分:HDFS 中的數據 Management
- 各種資料格式(JSON / Avro / Parquet)
- 壓縮方案
- 數據脫敏
- 實驗室:分析不同的數據格式;啟用壓縮
第 2 部分:高級清管器
- 用戶定義的函數
- Pig 庫簡介 (ElephantBird / Data-Fu)
- 使用 Pig 載入複雜的結構化數據
- 清管器調整
- 實驗室:高級清管腳本,解析複雜數據類型
第 3 部分:高級 Hive
- 用戶定義的函數
- 壓縮表
- Hive 性能調優
- 實驗室:創建壓縮表,評估表格式和配置
第4部分:高級 HBase
- 高級模式建模
- 壓縮
- 批量數據攝取
- 寬工作臺/高工作台比較
- HBase 和 Pig
- HBase 和 Hive
- HBase 性能調優
- 實驗室:調整 HBase;從 Pig 訪問 HBase 數據 & Hive;使用 Phoenix 進行數據建模
最低要求
-
熟悉 Java 程式設計
- 語言(大多數程式設計練習都是用 Java 進行的)
- 在 Linux 環境中感到舒適(能夠導航 Linux 命令行,使用 vi / nano 編輯檔)
- Hadoop 的應用 知識。
實驗室環境
零安裝: 無需在學生機器上安裝hadoop軟體!將為學生提供一個有效的hadoop集群。
學生將需要以下內容
- SSH 用戶端(Linux 和 Mac 已經有 ssh 用戶端,對於 Windows 建議使用 Putty )
- 用於訪問群集的瀏覽器。我們推薦 Firefox瀏覽器
21 時間:
客戶評論 (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay