課程簡介

引言

  • 構建有效的模式識別、分類和迴歸算法。

設置開發環境

  • Python庫
  • 線上與線下編輯器

特徵工程概述

  • 輸入和輸出變量(特徵)
  • 特徵工程的優缺點

原始數據中常見的問題類型

  • 數據不乾淨、數據缺失等。

預處理變量

  • 處理缺失數據

處理數據中的缺失值

處理分類變量

將標籤轉換爲數字

處理分類變量中的標籤

轉換變量以提高預測能力

  • 數值型、分類型、日期型等。

清理數據集

機器學習建模

處理數據中的異常值

  • 數值型變量、分類型變量等。

總結與結論

最低要求

  • 具備Python編程經驗。
  • 熟悉Numpy、Pandas和scikit-learn。
  • 瞭解機器學習算法。

目標受衆

  • 開發者
  • 數據科學家
  • 數據分析師
 14 時間:

客戶評論 (2)

課程分類