課程簡介
引言
- 構建有效的模式識別、分類和迴歸算法。
設置開發環境
- Python庫
- 線上與線下編輯器
特徵工程概述
- 輸入和輸出變量(特徵)
- 特徵工程的優缺點
原始數據中常見的問題類型
- 數據不乾淨、數據缺失等。
預處理變量
- 處理缺失數據
處理數據中的缺失值
處理分類變量
將標籤轉換爲數字
處理分類變量中的標籤
轉換變量以提高預測能力
- 數值型、分類型、日期型等。
清理數據集
機器學習建模
處理數據中的異常值
- 數值型變量、分類型變量等。
總結與結論
最低要求
- 具備Python編程經驗。
- 熟悉Numpy、Pandas和scikit-learn。
- 瞭解機器學習算法。
目標受衆
- 開發者
- 數據科學家
- 數據分析師
客戶評論 (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
課程 - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.
