課程簡介
模塊1:核心Python用於ML工作流
• 課程啓動與環境設置
明確目標,並設置可復現的Python ML工作環境
• Python語言基礎(快速入門)
回顧ML代碼庫中常用的語法、控制流、函數和模式
• 用於ML的數據結構
列表、字典、集合和元組,用於特徵、標籤和元數據
• 推導式與函數式工具
使用推導式和高階函數表達轉換
• 面向對象的Python用於ML開發者
類、方法、組合和實用的設計決策
• dataclasses與輕量級建模
用於配置、示例和結果的類型化容器
• 裝飾器與上下文管理器
計時、緩存、日誌記錄和資源安全執行模式
• 處理文件與路徑
穩健的數據集處理與序列化格式
• 異常與防禦性編程
編寫安全且透明的ML腳本
• 模塊、包與項目結構
組織可重用的ML代碼庫
• 類型與代碼質量
類型提示、文檔和lint友好的結構
模塊2:數值Python、SciPy與數據處理
• NumPy基礎:向量化計算
高效的數組操作與性能感知編碼
• 索引、切片、廣播與形狀
安全的張量操作與形狀推理
• 線性代數基礎:NumPy與SciPy
ML中使用的穩定矩陣操作與分解
• SciPy深入探討
統計、優化、曲線擬合與稀疏矩陣
• Pandas用於表格ML數據
數據清洗、連接、聚合與數據集準備
• scikit-learn深入探討
估計器接口、管道與可復現的工作流
• 可視化基礎
數據探索與模型行爲的診斷圖
模塊3:構建ML應用的編程模式
• 從筆記本到可維護的項目
將探索性代碼重構爲結構化包
• 配置管理
外部化參數與啓動驗證
• 日誌、警告與可觀測性
結構化日誌記錄,用於可調試的ML系統
• 可複用組件:OOP與組合
設計可擴展的轉換器與預測器
• 實用設計模式
管道、工廠或註冊、策略與適配器模式
• 數據驗證與模式檢查
防止數據問題無聲發生
• 性能與剖析
識別瓶頸並應用優化技術
• 模型I/O與推理接口
安全的持久化與乾淨的預測接口
• 端到端迷你構建
生產級ML管道,包含配置與日誌記錄
模塊4:統計學習:表格、文本與圖像
• 評估基礎
訓練與驗證集劃分,誠實交叉驗證與業務對齊的指標
• 高級表格ML
正則化GLM、樹集成與無泄漏預處理
• 校準與不確定性
Platt縮放、等滲迴歸、自舉與保形預測
• 經典NLP方法
分詞權衡、TF-IDF、線性模型與樸素貝葉斯
• 主題建模
LDA基礎與實際限制
• 經典計算機視覺
HOG、PCA與基於特徵的管道
• 錯誤分析
偏差檢測、標籤噪聲與虛假相關性
• 動手實驗
無泄漏表格管道
文本基線比較與解釋
經典視覺基線,包含結構化失敗分析
模塊5:神經網絡:表格、文本與圖像
• 訓練循環精通
乾淨的PyTorch循環,包含AMP、裁剪與可復現性
• 優化與正則化
初始化、歸一化、優化器與調度器
• 混合精度與縮放
梯度累積與檢查點策略
• 表格神經網絡
類別嵌入、特徵交叉與消融研究
• 文本神經網絡
嵌入、CNN、BiLSTM或GRU與序列處理
• 視覺神經網絡
CNN基礎與ResNet風格架構
• 動手實驗
可複用的訓練框架
表格NN與提升算法比較
CNN,包含數據增強與調度實驗
模塊6:高級神經網絡架構
• 遷移學習策略
凍結與解凍模式,判別學習率
• Transformer架構:文本
自注意力內部機制與微調方法
• 視覺骨幹與密集預測
ResNet、EfficientNet、Vision Transformers與U-Net概念
• 高級表格架構
TabTransformer、FT-Transformer與深度交叉網絡
• 時間序列考慮
時間劃分與協變量漂移檢測
• PEFT與效率技術
LoRA、蒸餾與量化權衡
• 動手實驗
微調預訓練文本Transformer
微調預訓練視覺模型
表格Transformer與GBDT比較
模塊7:生成式AI系統
• 提示基礎
結構化提示與控制生成
• LLM基礎
分詞、指令微調與幻覺緩解
• 檢索增強生成
分塊、嵌入、混合搜索與評估指標
• 微調策略
LoRA與QLoRA,包含數據質量控制
• 擴散模型
潛在擴散直覺與實際適應
• 合成表格數據
CTGAN與隱私考慮
• 動手實驗
生產級RAG迷你應用
結構化輸出驗證,包含模式強制執行
可選擴散實驗
模塊8:AI Agent與MCP
• Agent循環設計
觀察、計劃、執行、反思與持久化
• Agent架構
ReAct、計劃-執行與多Agent協調
• 內存管理
情景、語義與便籤方法
• 工具集成與安全
工具契約、沙盒與提示注入防禦
• 評估框架
可重放跟蹤、任務套件與迴歸測試
• MCP與協議互操作性
設計MCP服務器,包含安全工具暴露
• 動手實驗
從零構建Agent
通過MCP風格服務器暴露工具
創建評估框架,包含安全約束
最低要求
學員應具備Python編程的工作知識。
本課程面向中級到高級技術專業人員。
客戶評論 (2)
ML生態系統不僅包括MLFlow,還有Optuna、hyperops、docker、docker-compose
Guillaume GAUTIER - OLEA MEDICAL
課程 - MLflow
機器翻譯
我參加了Kubeflow的遠程培訓,這次培訓讓我鞏固了關於AWS服務、K8s以及圍繞Kubeflow的所有DevOps工具的知識,這些都是正確應對該主題的必要基礎。我想感謝Malawski Marcin的耐心和專業精神,他在培訓和最佳實踐建議方面做得非常出色。Malawski從不同角度探討了該主題,使用了不同的部署工具,如Ansible、EKS kubectl和Terraform。現在,我完全確信自己正在進入正確的應用領域。
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
課程 - Kubeflow
機器翻譯