課程簡介

介紹

  • Kubeflow 在 AWS 上 vs 本地 vs 其他公有云提供商

Kubeflow 功能與架構概述

激活 AWS 賬戶

準備並啓動支持 GPU 的 AWS 實例

設置用戶角色和權限

準備構建環境

選擇 TensorFlow 模型和數據集

將代碼和框架打包到 Docker 鏡像中

使用 EKS 設置 Kubernetes 集羣

暫存訓練和驗證數據

配置 Kubeflow 流水線

使用 Kubeflow 在 EKS 中啓動訓練任務

即時可視化訓練任務

任務完成後的清理工作

故障排除

總結與結論

最低要求

  • 瞭解機器學習概念。
  • 具備雲計算概念知識。
  • 對容器(Docker)和編排(Kubernetes)有基本瞭解。
  • 有一定的 Python 編程經驗會有所幫助。
  • 具備命令行操作經驗。

目標受衆

  • 數據科學工程師。
  • 對機器學習模型部署感興趣的 DevOps 工程師。
  • 對機器學習模型部署感興趣的基礎設施工程師。
  • 希望集成並部署機器學習功能的軟件工程師。
 28 時間:

客戶評論 (3)

課程分類