課程簡介

Teradata 简介

模块 1: Teradata 基础与架构

  • Teradata 是什么?它有哪些用途?
  • 并行架构:AMPs, PEs, BYNET
  • 数据分布与哈希
  • 关键概念:会话、spool、锁
  • 系统连接:Teradata Studio / BTEQ / SQL Assistant

模块 2: Teradata 中的 SQL 简介

  • 基本 SELECT, WHERE, ORDER BY
  • 数据类型与类型转换
  • 数学与日期函数
  • 使用 ALIAS, CASE 表达式
  • Teradata 特定操作符(TOP, QUALIFY, SAMPLE)
  • 指导实践:在真实表上执行查询

模块 3: 连接、子查询与集合操作符

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • 无 ON 子句的连接(笛卡尔积)
  • 标量与相关子查询
  • UNION, INTERSECT, MINUS
  • 数据集成实践练习

模块 4: 分析与 OLAP 函数

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • 使用 PARTITION BY 进行数据分区
  • 使用 OVER() 和 ORDER BY 进行窗口操作
  • LAG(), LEAD(), FIRST_VALUE()
  • 用例:KPI、趋势、累计值

模块 5: 数据与表 Management

  • 表类型:永久表、临时表、全局临时表
  • 创建与使用二级索引和连接索引
  • 插入、更新与删除操作
  • MERGE, UPSERT 与重复控制
  • 事务与锁控制

模块 6: 优化与性能调优

  • Teradata 优化器:如何选择执行计划
  • 使用 EXPLAIN 和 COLLECT STATISTICS
  • 数据倾斜及其避免方法
  • 查询设计最佳实践
  • 瓶颈识别(spool、锁、重分布)
  • 实践:比较优化与非优化查询

模块 7: 数据分区与压缩

  • 分区类型:范围分区、案例分区、多级分区
  • 在大规模查询中的优势与实际应用
  • 块级压缩 (BLC) 与列式压缩
  • 优势与局限性

模块 8: 数据加载与提取

  • TPT (Teradata 并行传输器) 与 FastLoad / MultiLoad
  • 批量加载与批量插入
  • 错误处理与重试
  • 将结果导出到文件或外部系统
  • 使用脚本与工具进行基本自动化

模块 9: 技术用户的基本管理

  • 角色与权限
  • 资源控制(Query Bands, Priority Scheduler)
  • 使用 DBQLOGTBL, DBC.Tables, ResUsage 进行监控
  • 共享环境的最佳实践

模块 10: 最终集成实验

  • 端到端实践案例:
  • 数据加载
  • 转换与聚合
  • 使用 OLAP 函数构建 KPI
  • 优化与 EXPLAIN
  • 最终导出
  • 讨论最佳实践与常见错误

总结与下一步

最低要求

  • 理解关系型数据库和SQL概念
  • 有查询大数据集或在数据环境中工作的经验
  • 熟悉商业智能或分析目标

受众

  • 数据分析师和商业智能专业人员
  • SQL开发者和数据工程师
  • 在Teradata环境中管理或优化数据的技术用户
 35 時間:

客戶評論 (1)

課程分類