課程簡介

第一天:語言基礎

  • 課程介紹
  • 關於數據科學
    • 數據科學的定義
    • 數據科學的流程
  • R語言介紹
  • 變量與類型
  • 控制結構(循環/條件語句)
  • R標量、向量和矩陣
    • 定義R向量
    • 矩陣
  • 字符串與文本操作
    • 字符數據類型
    • 文件輸入輸出
  • 列表
  • 函數
    • 函數介紹
    • 閉包
    • lapply/sapply函數
  • 數據框
  • 各部分的實驗

第二天:中級R編程

  • 數據框與文件輸入輸出
  • 從文件讀取數據
  • 數據準備
  • 內置數據集
  • 可視化
    • 圖形包
    • plot()/barplot()/hist()/boxplot()/散點圖
    • 熱力圖
    • ggplot2包(qplot(), ggplot())
  • 使用Dplyr進行探索
  • 各部分的實驗

第三天:R高級編程

  • 使用R進行統計建模
    • 統計函數
    • 處理NA值
    • 分佈(二項式、泊松、正態)
  • 迴歸分析
    • 線性迴歸介紹
  • 推薦系統
  • 文本處理(tm包/詞雲)
  • 聚類分析
    • 聚類介紹
    • K均值聚類
  • 分類
    • 分類介紹
    • 樸素貝葉斯
    • 決策樹
    • 使用caret包進行訓練
    • 算法評估
  • R與大數據
    • 將R連接到數據庫
    • 大數據生態系統
  • 各部分的實驗

最低要求

  • 具備基本的編程背景爲佳

設置

  • 一臺現代筆記本電腦
  • 安裝最新版本的R Studio和R環境
 21 時間:

客戶評論 (7)

課程分類