課程簡介

第一天

  1. R 和 Rstudio 简介 (2 小时)
    • 让 R 更友好,R 及可用的 GUI
    • Rstudio
    • 在 Rstudio 中编写脚本
    • 导航、分区和代码折叠
    • 在 RStudio 中排除故障和调试代码
    • 相关软件和文档
    • 获取函数和功能的帮助
    • RStudio 中的项目
    • 使用 RStudio 创建分析报告
    • 键盘快捷键和有用功能
  2. 导入/导出数据 (1 小时)
    • 平面文件 – txt, csv
    • 电子表格文件 – xls, xlsx
    • SPSS, SAS 及其他格式数据
    • 从 SQL 数据源中 Access 数据
    • SQL 数据库连接与操作
  3. 组织数据 (2 小时)
    • 数据类型和类
    • R 中的数据存储 – Rdata 格式
    • 对象结构
    • 数字和向量
    • Matrix 和表格
    • 因子
    • 列表
    • 数据框
    • 日期和时间
  4. 表格表示 (3 小时)
    • 数据表包概览 – dplyr, tidyr, data.table
    • 索引和下标
    • 选择、子集化观察值和变量
    • 过滤、分组
    • 重新编码转换
    • 重塑数据
    • 合并数据
    • 字符操作,stringr 包
    • 正则表达式

第二天

  1. 相关软件和文档 (1 小时)
    • Rstudio 和 GIT - 版本控制
    • Markdown
    • 使用 LaTeX 的报告和演示
    • Shiny 网络应用程序
  2. R 和 Statistics (2 小时)
    • 概率和正态分布
    • 随机数
    • 描述性 Statistics
    • 标准化和归一化
    • 置信区间
    • 假设检验
    • ANOVA
    • 定性数据分析
  3. 线性回归 (2 小时)
    • 相关系数及解释
    • 简单和多元线性回归
    • 估计方法 – 最小二乘法
    • 模型验证 – 假设违反的检验
    • 选择变量 – 不同方法
    • 正则化 – 岭回归和 LASSO 回归
    • 广义最小二乘法 – 非线性
    • 逻辑回归
  4. 图形程序 (2 小时)
    • 单变量的基本图表
    • 两个及以上变量的可视化
    • 图形参数
    • 特殊图表
    • 将图表导出为 png, pdf 和 jpeg 文件
    • 使用 ggplot2 扩展 R 的图形功能
  5. R 中的帮助 (1 小时)
    • 搜索 R 的文档
    • R 包和文档
    • R Cran Task View – 搜索问题解决方案

最低要求

本课程无需特定先决条件。

 14 時間:

客戶評論 (1)

課程分類