課程簡介

Biren GPU 架構簡介

  • Biren 概述及應用場景
  • 硬件佈局:核心、內存、計算集羣
  • 與 NVIDIA 和 AMD GPU 的對比

搭建 Biren Programming 環境

  • 安裝 Biren SDK 和運行時
  • 理解工具鏈和編譯器模型
  • 基本項目結構與構建過程

使用 Biren 堆棧進行 GPU Programming

  • 線程和塊模型
  • 內存管理與數據傳輸
  • 內核開發與啓動模式

從 CUDA 遷移到 Biren

  • CUDA 代碼的轉換技術
  • 常見 API 映射與適配
  • 代碼轉換實驗與實踐

調試與性能分析

  • 使用 Biren 的調試器和性能分析器
  • 識別性能瓶頸
  • 內存訪問模式與優化

優化技術

  • 線程調度與指令流水線
  • 循環展開與共享內存使用
  • 高級內核調優以提高吞吐量

案例研究與應用示例

  • 使用 Biren 加速器訓練模型
  • 遷移與性能分析視覺或 NLP 模型
  • 與 CUDA/NVIDIA 的性能對比

總結與下一步

最低要求

  • 瞭解GPU架構與並行處理
  • 具備CUDA、OpenCL或類似GPU編程環境的經驗
  • 熟悉深度學習框架,如PyTorch或TensorFlow

受衆

  • HPC開發者
  • AI基礎設施工程師
  • 性能優化專家
 21 時間:

客戶評論 (1)

課程分類