課程簡介

Cambricon與MLU架構介紹

  • Cambricon AI晶片產品概覽
  • MLU架構與指令流水線
  • 支援的模型類型與應用場景

安裝開發工具鏈

  • 安裝BANGPy與Neuware SDK
  • Python與C++的環境設置
  • 模型兼容性與預處理

使用BANGPy進行模型開發

  • 張量結構與形狀管理
  • 計算圖構建
  • BANGPy中的自定義操作支援

使用Neuware Runtime進行部署

  • 模型轉換與加載
  • 執行與推理控制
  • 邊緣與數據中心部署實踐

性能優化

  • 內存映射與層調優
  • 執行追蹤與性能分析
  • 常見瓶頸與解決方案

將MLU整合至應用中

  • 使用Neuware APIs進行應用整合
  • 串流與多模型支援
  • 混合CPU-MLU推理場景

端到端項目與Use Case

  • 實驗室:部署視覺或NLP模型
  • 使用BANGPy整合進行邊緣推理
  • 測試準確性與吞吐量

總結與下一步

最低要求

  • 了解機器學習模型結構
  • 具備Python和/或C++的經驗
  • 熟悉模型部署與加速概念

目標受眾

  • 嵌入式AI開發者
  • 部署至邊緣或數據中心的ML工程師
  • 使用中國AI基礎設施的開發者
 21 時間:

課程分類