課程簡介

MLOps on Kubernetes基礎

  • MLOps的核心概念
  • MLOps與傳統DevOps的對比
  • 機器學習生命週期管理的關鍵挑戰

容器化機器學習工作負載

  • 打包模型和訓練代碼
  • 優化機器學習容器鏡像
  • 管理依賴項和可重複性

機器學習的CI/CD

  • 構建自動化機器學習倉庫結構
  • 集成測試和驗證步驟
  • 觸發重新訓練和更新的流水線

模型部署的GitOps

  • GitOps原則和工作流
  • 使用Argo CD進行模型部署
  • 模型和配置的版本控制

Kubernetes上的流水線編排

  • 使用Tekton構建流水線
  • 管理多步驟的機器學習工作流
  • 調度和資源管理

監控、日誌記錄和回滾策略

  • 跟蹤數據漂移和模型性能
  • 集成告警和可觀測性
  • 回滾和故障轉移方法

自動化重新訓練和持續改進

  • 設計反饋循環
  • 自動化定期重新訓練
  • 集成MLflow進行跟蹤和實驗管理

高級MLOps架構

  • 多集羣和混合雲部署模型
  • 通過共享基礎設施擴展團隊
  • 安全和合規性考慮

總結與下一步

最低要求

  • 對Kubernetes基礎知識的理解
  • 具備機器學習工作流的經驗
  • 熟悉基於Git的開發

受衆

  • 機器學習工程師
  • DevOps工程師
  • 機器學習平臺團隊
 14 時間:

客戶評論 (3)

課程分類