課程簡介
-
機器學習簡介
機器學習的類型——監督學習與無監督學習
從統計學習到機器學習
資料挖掘工作流:
業務理解
數據理解
數據準備
造型
評估
部署
機器學習演算法
為問題選擇適當的演算法
ML 中的過擬合和偏差-方差權衡
ML 庫和程式設計語言
為什麼要使用程式設計語言
在 R 和 Python 之間進行選擇
Python 速成班
Python 資源
用於機器學習的 Python 庫
Jupyter 筆記本和互動式編碼
測試 ML 演算法
泛化和過擬合
避免過擬合
Holdout 方法
交叉驗證
引導
評估數值預測
精度測量:ME、MSE、RMSE、MAPE
參數和預測穩定性
評估分類演算法
準確性及其問題
混淆矩陣
班級不平衡問題
可視化模型性能
利潤曲線
ROC曲線
提升曲線
選型
模型調優 - 網格搜索策略
Python 中的示例
數據準備
數據導入和存儲
了解數據 - 基本探索
使用 pandas 庫進行數據操作
數據轉換 – 數據整理
探索性分析
缺失觀測值 – 檢測和解決方案
異常值 – 檢測和策略
標準化、規範化、二值化
定性數據重新編碼
Python 中的示例
分類
二元類與多類分類
通過數學函數進行分類
線性判別函數
二次判別函數
Logistic回歸和概率方法
k 最近鄰
樸素貝葉斯
決策樹
車
裝袋
Random Forest秒
提高
Xgboost的
支援向量機和內核
最大邊距分類器
支援向量機
集成學習
Python 中的示例
回歸和數值預測
最小二乘估計
變數選擇技術
正則化和穩定性 - L1、L2
非線性和廣義最小二乘法
多項式回歸
回歸樣條曲線
回歸樹
Python 中的示例
無監督學習
聚類
基於質心的聚類 – k-means、k-medoids、PAM、CLARA
分層聚類 – Diana, Agnes
基於模型的聚類 - EM
自組織地圖
集群評估和評估
降維
主成分分析和因數分析
奇異值分解
多維擴展
Python 中的示例
文本挖掘
預處理數據
詞袋模型
詞幹提取和詞形還原
分析詞頻
情緒分析
創建詞雲
Python 中的示例
推薦引擎和協同過濾
推薦數據
基於使用者的協同過濾
基於專案的協同篩選
Python 中的示例
關聯模式挖掘
頻繁項集演算法
市場籃子分析
Python 中的示例
異常值分析
極值分析
基於距離的異常值檢測
基於密度的方法
高維異常值檢測
Python 中的示例
機器學習案例研究
業務問題理解
數據預處理
演算法選擇和調優
對結果的評價
部署
最低要求
對 Machine Learning 基礎知識的知識和認識
客戶評論 (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback