GPU編程 - OpenCL vs CUDA vs ROCm培訓

GPU編程是一種利用GPU的並行處理能力來加速需要高性能計算的應用的技術，例如人工智能、遊戲、圖形和科學計算。有多種框架支持GPU編程，每種框架都有其優缺點。OpenCL是一個開放標準，可用於編程不同廠商的CPU、GPU和其他設備，而CUDA專用於NVIDIA GPU。ROCm是一個支持AMD GPU編程的平臺，同時提供與CUDA和OpenCL的兼容性。

本次由講師指導的培訓（線上或線下）面向初學者到中級開發者，旨在幫助他們使用不同的GPU編程框架，並比較其特性、性能和兼容性。

培訓結束後，參與者將能夠：

設置包含OpenCL SDK、CUDA Toolkit、ROCm平臺、支持OpenCL、CUDA或ROCm的設備以及Visual Studio Code的開發環境。
使用OpenCL、CUDA和ROCm創建一個執行向量加法的基本GPU程序，並比較每個框架的語法、結構和執行方式。
使用各自的API查詢設備信息、分配和釋放設備內存、在主機和設備之間複製數據、啓動內核並同步線程。
使用各自的語言編寫在設備上執行並操作數據的內核。
使用各自的內置函數、變量和庫來執行常見任務和操作。
使用各自的內存空間（如全局、本地、常量和私有）來優化數據傳輸和內存訪問。
使用各自的執行模型來控制定義並行性的線程、塊和網格。
使用CodeXL、CUDA-GDB、CUDA-MEMCHECK和NVIDIA Nsight等工具調試和測試GPU程序。
使用合併、緩存、預取和分析等技術優化GPU程序。

課程形式

互動式講座和討論。
大量練習和實踐。
在實驗環境中進行實際操作。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

介紹

什麼是GPU編程？
爲什麼要使用GPU編程？
GPU編程的挑戰和權衡是什麼？
GPU編程的框架有哪些？
爲您的應用程序選擇正確的框架

OpenCL

什麼是OpenCL？
OpenCL的優缺點是什麼？
設置OpenCL的開發環境
創建一個執行向量加法的基本OpenCL程序
使用OpenCL API查詢設備信息、分配和釋放設備內存、在主機和設備之間複製數據、啓動內核並同步線程
使用OpenCL C語言編寫在設備上執行並操作數據的內核
使用OpenCL內置函數、變量和庫來執行常見任務和操作
使用OpenCL內存空間（如全局、本地、常量和私有）來優化數據傳輸和內存訪問
使用OpenCL執行模型來控制定義並行性的工作項、工作組和ND範圍
使用CodeXL等工具調試和測試OpenCL程序
使用合併、緩存、預取和分析等技術優化OpenCL程序

CUDA

什麼是CUDA？
CUDA的優缺點是什麼？
設置CUDA的開發環境
創建一個執行向量加法的基本CUDA程序
使用CUDA API查詢設備信息、分配和釋放設備內存、在主機和設備之間複製數據、啓動內核並同步線程
使用CUDA C/C++語言編寫在設備上執行並操作數據的內核
使用CUDA內置函數、變量和庫來執行常見任務和操作
使用CUDA內存空間（如全局、共享、常量和本地）來優化數據傳輸和內存訪問
使用CUDA執行模型來控制定義並行性的線程、塊和網格
使用CUDA-GDB、CUDA-MEMCHECK和NVIDIA Nsight等工具調試和測試CUDA程序
使用合併、緩存、預取和分析等技術優化CUDA程序

ROCm

什麼是ROCm？
ROCm的優缺點是什麼？
設置ROCm的開發環境
創建一個執行向量加法的基本ROCm程序
使用ROCm API查詢設備信息、分配和釋放設備內存、在主機和設備之間複製數據、啓動內核並同步線程
使用ROCm C/C++語言編寫在設備上執行並操作數據的內核
使用ROCm內置函數、變量和庫來執行常見任務和操作
使用ROCm內存空間（如全局、本地、常量和私有）來優化數據傳輸和內存訪問
使用ROCm執行模型來控制定義並行性的線程、塊和網格
使用ROCm調試器和ROCm分析器等工具調試和測試ROCm程序
使用合併、緩存、預取和分析等技術優化ROCm程序

比較

比較OpenCL、CUDA和ROCm的特性、性能和兼容性
使用基準測試和指標評估GPU程序
學習GPU編程的最佳實踐和技巧
探索GPU編程的當前和未來趨勢與挑戰

總結與下一步

最低要求

瞭解C/C++語言和並行編程概念
具備計算機架構和內存層次結構的基礎知識
有使用命令行工具和代碼編輯器的經驗

受衆

希望學習如何使用不同框架進行GPU編程並比較其特性、性能和兼容性的開發者
希望編寫可在不同平臺和設備上運行的便攜且可擴展代碼的開發者
希望探索GPU編程和優化的權衡與挑戰的程序員

28 小時

需要幫助選擇合適的課程嗎？

GPU編程 - OpenCL vs CUDA vs ROCm培訓

課程簡介

最低要求

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

GPU編程 - OpenCL vs CUDA vs ROCm培訓

課程簡介

最低要求

相關課程

使用華爲Ascend和CANN開發AI應用

使用CANN和Ascend AI處理器部署AI模型

GPU Programming 關於Biren AI加速器

Cambricon MLU Development with BANGPy and Neuware

CANN AI 框架開發者入門

CANN 用於 Edge AI 部署

理解華為AI計算堆疊：從CANN到MindSpore

使用CANN SDK優化神經網絡性能

CANN SDK用於計算機視覺與自然語言處理管道

使用CANN TIK和TVM构建自定义AI算子

Migrating CUDA Applications to Chinese GPU Architectures

Performance Optimization on Ascend, Biren, and Cambricon

課程分類

GPU

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites