課程簡介
MLOps on Kubernetes基礎
- MLOps的核心概念
- MLOps與傳統DevOps的對比
- 機器學習生命週期管理的關鍵挑戰
容器化機器學習工作負載
- 打包模型和訓練代碼
- 優化機器學習容器鏡像
- 管理依賴項和可重複性
機器學習的CI/CD
- 構建自動化機器學習倉庫結構
- 集成測試和驗證步驟
- 觸發重新訓練和更新的流水線
模型部署的GitOps
- GitOps原則和工作流
- 使用Argo CD進行模型部署
- 模型和配置的版本控制
Kubernetes上的流水線編排
- 使用Tekton構建流水線
- 管理多步驟的機器學習工作流
- 調度和資源管理
監控、日誌記錄和回滾策略
- 跟蹤數據漂移和模型性能
- 集成告警和可觀測性
- 回滾和故障轉移方法
自動化重新訓練和持續改進
- 設計反饋循環
- 自動化定期重新訓練
- 集成MLflow進行跟蹤和實驗管理
高級MLOps架構
- 多集羣和混合雲部署模型
- 通過共享基礎設施擴展團隊
- 安全和合規性考慮
總結與下一步
最低要求
- 對Kubernetes基礎知識的理解
- 具備機器學習工作流的經驗
- 熟悉基於Git的開發
受衆
- 機器學習工程師
- DevOps工程師
- 機器學習平臺團隊
客戶評論 (3)
他很有耐心,明白我們落後了
Albertina - REGNOLOGY ROMANIA S.R.L.
課程 - Deploying Kubernetes Applications with Helm
機器翻譯
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
課程 - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.