課程簡介

簡介 Teradata

模組 1: Teradata 基礎與架構

  • Teradata 是什麼?它的用途是什麼?
  • 平行架構:AMPs、PEs、BYNET
  • 數據分佈與哈希
  • 關鍵概念:會話、spool、鎖
  • 系統連接:Teradata Studio / BTEQ / SQL Assistant

模組 2: Teradata 中的 SQL 簡介

  • 基礎 SELECT、WHERE、ORDER BY
  • 數據類型與轉換
  • 數學與日期函數
  • 使用 ALIAS、CASE 表達式
  • Teradata 專用運算符(TOP、QUALIFY、SAMPLE)
  • 指導練習:在實際表格上進行查詢

模組 3: 聯接、子查詢與集合運算符

  • INNER、LEFT、RIGHT、FULL OUTER JOIN
  • 沒有 ON 子句的聯接(笛卡爾積)
  • 標量與相關子查詢
  • UNION、INTERSECT、MINUS
  • 數據整合的實際練習

模組 4: 分析與 OLAP 函數

  • RANK()、ROW_NUMBER()、DENSE_RANK()
  • 使用 PARTITION BY 進行數據分區
  • 使用 OVER() 和 ORDER BY 進行窗口操作
  • LAG()、LEAD()、FIRST_VALUE()
  • 應用案例:KPI、趨勢、累計值

模組 5: 數據與表格 Management

  • 表格類型:永久、臨時、全局臨時
  • 創建與使用次級與聯接索引
  • 插入、更新與刪除操作
  • MERGE、UPSERT 與重複控制
  • 事務與鎖控制

模組 6: 優化與性能調校

  • Teradata 優化器:如何選擇執行計劃
  • 使用 EXPLAIN 和 COLLECT STATISTICS
  • 數據傾斜及其避免方法
  • 查詢設計最佳實踐
  • 瓶頸識別(spool、鎖、重新分佈)
  • 實踐:比較優化與非優化查詢

模組 7: 數據分區與壓縮

  • 分區類型:範圍、案例、多級
  • 大規模查詢中的優勢與實際應用
  • 塊級壓縮(BLC)與列式壓縮
  • 優勢與限制

模組 8: 數據加載與提取

  • TPT (Teradata 平行傳輸器) vs. FastLoad / MultiLoad
  • 批量加載 vs. 批量插入
  • 錯誤處理與重試
  • 將結果導出到文件或外部系統
  • 使用腳本與工具進行基礎自動化

模組 9: 技術用戶的基礎管理

  • 角色與權限
  • 資源控制(Query Bands、Priority Scheduler)
  • 使用 DBQLOGTBL、DBC.Tables、ResUsage 進行監控
  • 共享環境中的最佳實踐

模組 10: 最終整合實驗室

  • 端到端實際案例:
  • 數據加載
  • 轉換與聚合
  • 使用 OLAP 函數構建 KPI
  • 優化與 EXPLAIN
  • 最終導出
  • 最佳實踐與常見錯誤討論

總結與下一步

最低要求

  • 了解关系型数据库和SQL概念
  • 具备查询大型数据集或在数据环境中工作的经验
  • 熟悉商业智能或分析目标

受众

  • 数据分析和商业智能专业人士
  • SQL开发人员和数据工程师
  • 在Teradata环境中管理或优化数据的技术用户
 35 時間:

客戶評論 (1)

課程分類