使用CUDA進行GPU編程培訓

CUDA是一種開放標準的GPU編程語言，允許代碼在NVIDIA GPU上運行。NVIDIA GPU廣泛用於高性能計算、人工智能（AI）、遊戲和圖形處理。CUDA讓程序員能夠深入瞭解硬體細節，並完全掌控平行化過程。然而，這也要求對設備架構、記憶體模型、執行模型以及最佳化技術有充分的理解。

此培訓為由導師指導的現場課程（線上或線下），旨在幫助初級至中級開發人員使用CUDA編程NVIDIA GPU，並充分利用其平行運算能力。

完成此培訓後，學員將能夠：

搭建包含CUDA Toolkit、NVIDIA GPU和Visual Studio Code的開發環境。
創建基本的CUDA程序，在GPU上執行向量加法並將結果從GPU記憶體取回。
使用CUDA API查詢設備資訊、配置和釋放裝置記憶體、在主機與設備間複製數據、啟動內核以及同步執行緒。
使用CUDA C/C++語言編寫在GPU上執行的內核並操作數據。
使用CUDA內建函式、變數和庫來完成常見任務和操作。
使用CUDA記憶體空間（如全域、共享、常數和本地）來優化資料傳輸和記憶體存取。
使用CUDA執行模型控制定義平行化的執行緒、區塊和網格。
使用CUDA-GDB、CUDA-MEMCHECK及NVIDIA Nsight等工具調試和測試CUDA程序。
通過並行存取、快取利用、預取以及分析技術最佳化CUDA程序。

課程形式

互動式講授與討論。
大量的練習與實踐機會。
在即時實驗室環境中進行實作操作。

課程客製化選項

如需此課程的客製化培訓，請聯繫我們安排。
96% 的客戶滿意

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

介紹

CUDA是什麼？
CUDA與OpenCL和SYCL的比較
CUDA特性和架構概述
設置開發環境

入門指南

使用Visual Studio Code創建新的CUDA項目
探索項目結構和文件
編譯並運行程序
使用printf和fprintf顯示輸出

CUDA API

了解CUDA API在主機程式中的作用
使用CUDA API查詢設備資訊和能力
使用CUDA API配置和釋放裝置記憶體
使用CUDA API在主機與設備間複製數據
使用CUDA API啟動內核並同步執行緒
使用CUDA API處理錯誤和異常

CUDA C/C++

了解CUDA C/C++在設備程式中的作用
使用CUDA C/C++編寫在GPU上執行的內核並操作數據
使用CUDA C/C++的數據類型、修飾符、運算符和表達式
使用CUDA C/C++內建函式，如數學函式、原子操作、Warp功能等
使用CUDA C/C++內建變數，如threadIdx、blockIdx、blockDim等
使用CUDA C/C++庫，如cuBLAS、cuFFT、cuRAND等

CUDA記憶體模型

理解主機和設備記憶體模型的差異
使用CUDA記憶體空間，如全域、共享、常數和本地
使用CUDA記憶體物件，如指標、陣列、紋理和表面
使用CUDA記憶體存取模式，如唯讀、寫入只讀、讀寫等
使用CUDA記憶體一致性模型和同步機制

CUDA執行模型

理解主機和設備執行模型的差異
使用CUDA的執行緒、區塊和網格定義平行化
使用CUDA執行緒函式，如threadIdx、blockIdx、blockDim等
使用CUDA區塊函式，如__syncthreads、__threadfence_block等
使用CUDA網格函式，如gridDim、gridSync、協作群組等

調試

了解CUDA程式中常見的錯誤和Bug
使用Visual Studio Code除錯器檢查變數、斷點、呼叫堆疊等
在Linux上使用CUDA-GDB調試CUDA程式
使用CUDA-MEMCHECK檢測記憶體錯誤和洩漏
在Windows上使用NVIDIA Nsight調試和分析CUDA程式

最佳化

了解影響CUDA程式效能的因素
使用CUDA並行存取技術提高記憶體吞吐量
使用CUDA快取和預取技術降低記憶體延遲
使用CUDA共享記憶體和本地記憶體技術優化記憶體存取和頻寬
使用CUDA分析及分析工具衡量並改進執行時間和資源利用率

總結與下一步

最低要求

理解C/C++語言及平行程式設計概念。
具備電腦架構和記憶體層級的基本知識。
具有使用命令列工具和程式碼編輯器的經驗。

對象

希望學習如何使用CUDA編程NVIDIA GPU並發揮其平行能力的開發人員。
希望撰寫可在不同CUDA設備上運行的高效能和可擴展程式的開發人員。
希望探索GPU編程底層細節並最佳化代碼效能的程序員。

28 小時

需要幫助選擇合適的課程嗎？
macao@nobleprog.com 或 +852 81990613

使用CUDA進行GPU編程培訓

課程簡介

最低要求

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

使用CUDA進行GPU編程培訓

課程簡介

最低要求

相關課程

使用華為昇騰和CANN開發AI應用

部署使用 CANN 和 Ascend AI 處理器的 AI 模型

使用CloudMatrix進行AI推理和部署

在必能 AI 加速器上進行 GPU 程式設計

使用BANGPy和Neuware進行Cambricon MLU開發

AI框架開發者CANN入門

CANN用於邊緣AI部署

深入理解華為AI計算棧：從CANN到MindSpore

使用CANN SDK優化神經網路效能

CANN SDK for Computer Vision and NLP Pipelines

使用 CANN TIK 和 TVM 構建自定義 AI 運算子

將 CUDA 應用程式遷移至中國 GPU 架構

昇騰、壁仞和寒武紀的性能優化

課程分類

GPU

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites