課程簡介

中國AI GPU 生態系統概覽

  • Huawei Ascend、Biren、Cambricon MLU的比較
  • CUDA vs CANN、Biren SDK 和 BANGPy 模型
  • 行業趨勢與廠商生態系統

遷移準備

  • 評估您的CUDA代碼庫
  • 確定目標平台和SDK版本
  • 工具鏈安裝與環境設置

代碼轉譯技術

  • 移植CUDA內存訪問與核心邏輯
  • 映射計算網格/線程模型
  • 自動化與手動轉譯選項

平台特定實現

  • 使用華為CANN運算符與自定義核心
  • Biren SDK轉換流程
  • 使用BANGPy(Cambricon)重建模型

跨平台測試與優化

  • 在每個目標平台上進行性能分析
  • 內存調優與並行執行比較
  • 性能跟踪與迭代

管理混合GPU環境

  • 多架構混合部署
  • 備用策略與設備檢測
  • 代碼可維護性的抽象層

案例研究與最佳實踐

  • 將視覺/NLP模型移植到Ascend或Cambricon
  • 在Biren集群上改造推理流程
  • 處理版本不匹配與API差距

總結與下一步

最低要求

  • 具有使用CUDA或GPU應用程式的編程經驗
  • 了解GPU的記憶體模型和計算核心
  • 熟悉AI模型部署或加速工作流程

目標受眾

  • GPU程式設計師
  • 系統架構師
  • 移植專家
 21 時間:

課程分類