課程簡介

第一天:语言基础

  • 课程介绍
  • 关于Data Science
    • Data Science定义
    • Data Science的执行过程
  • 介绍R Language
  • 变量与类型
  • 控制结构(循环/条件)
  • R标量、向量与矩阵
    • 定义R向量
    • 矩阵
  • 字符串与文本操作
    • 字符数据类型
    • 文件I/O
  • 列表
  • 函数
    • 介绍函数
    • 闭包
    • lapply/sapply函数
  • DataFrames
  • 所有部分的实验

第二天:中级RProgramming

  • DataFrames与文件I/O
  • 从文件中读取数据
  • 数据准备
  • 内置数据集
  • 可视化
    • Graphics包
    • plot() / barplot() / hist() / boxplot() / 散点图
    • 热图
    • ggplot2包(qplot(), ggplot())
  • 使用Dplyr进行探索
  • 所有部分的实验

第三天:高级Programming与R

  • 使用R进行统计建模
    • 统计函数
    • 处理NA值
    • 分布(二项分布、泊松分布、正态分布)
  • 回归
    • 介绍线性回归
  • 推荐系统
  • 文本处理(tm包/Word词云)
  • 聚类
    • 聚类介绍
    • KMeans
  • 分类
    • 分类介绍
    • 朴素贝叶斯
    • 决策树
    • 使用caret包进行训练
    • 评估算法
  • R与Big Data
    • 将R连接到数据库
    • Big Data生态系统
  • 所有部分的实验

最低要求

  • 建議具備基礎程式設計背景

設定

 21 時間:

客戶評論 (7)

課程分類