部分Ⅰ 基 础 知 识
第1章 R简介
1.1 R简介
1.2 R的发展历史
1.3 R的功能
1.4 CRAN和Bioconductor
1.5 R的缺点
1.6 安装R
1.7 R的使用
1.7.1 第一次使用R
1.7.2 获取帮助
1.7.3 工作空间和工作目录
1.8 包的安装和使用
1.9 其他辅助工具
1.9.1 Rcmdr包:实现R的菜单化操作
1.9.2 rattle:可视化数据挖掘工具
1.9.3 Rstudio:一个友好的编辑器
第2章 数据结构
2.1 本章概要
2.2 数据结构
2.2.1 向量
2.2.2 矩阵
2.2.3 数组
2.2.4 因子
2.2.5 列表
2.2.6 数据框
2.3 数据的导入与导出
2.3.1 从键盘输入
2.3.2 从纯文本中读取数据
2.3.3 从其他文件中读取数据
2.3.4 从数据库中读取数据
2.3.5 写文件
2.3.6 使用Windows的粘贴板功能
2.3.7 保存输出
2.3.8 保存为R特有的格式
2.4 总结和补充
2.4.1 总结
2.4.2 补充
第3章 数据清理和转换
3.1 本章概要
3.2 数据清理
3.2.1 缺失值的处理
3.2.2 构建新变量
3.2.3 类型转化
3.2.4 排序
3.2.5 选取特定行或者子集
3.2.6 数据的合并
3.2.7 另一种操作数据框的方法
3.3 数据标准化和中心化
3.4 总结和补充
3.4.1 总结
3.4.2 补充
第4章 R中的函数
4.1 本章概要
4.2 数学函数
4.3 字符串函数
4.4 统计函数
4.5 矩阵计算
4.6 构建自己的函数
4.6.1 判断
4.6.2 循环
4.6.3 创建自己的函数
4.7 高级函数
4.7.1 apply函数族
4.7.2 数据重整
第5章 R绘图
5.1 本章概要
5.2 如何绘制一个图
5.3 保存图形
5.4 绘图时的一些参数设置
5.4.1 图形的边距
5.4.2 多幅图像的排列
5.5 基本绘图函数
5.5.1 设置点和线的类型
5.5.2 设置颜色
5.5.3 文本的大小和字体
5.5.4 设置标题
5.5.5 坐标轴
5.5.6 网格线
5.5.7 图例
5.5.8 文本标注
5.4.9 数学符号
5.5.10 对布局的控制
5.6 R中的基本图形
5.6.1 条形图
5.6.2 直方图和核密度图
5.6.3 饼图
5.6.4 箱线图
5.7 高级绘图函数
第6章 MySQL的安装和使用
6.1 本章概要
6.2 MySQL的安装
6.3 使用R连接MySQL
6.4 MySQL的基本语法
6.4.1 一般的SELECT语句
6.4.2 LIMIT
6.4.3 WHERE
6.4.4 HAVING
6.4.5 AS
6.4.6 ORDER BY
6.3.7 GROUP BY
6.4.8 JOIN
6.4.9 UNION
6.4.10 子查询
6.4.11 把查询结果写入外部文件
6.5 改、写数据库中的表
6.6 MySQL中常见的函数
6.6.1 字符串函数
6.6.2 数学函数
6.7 在R中使用数据
6.7.1 简单数据的展示
6.7.2 多维数据的展示
6.8 对数据进行定量分析
6.9 自动化报表的生成
部分II 案 例
第7章 鸢尾花的分类
7.1 问题描述与目标
7.2 数据描述
7.3 加载数据
7.4 了解你的数据
7.5 模型的建立
7.5.1 判别函数
7.5.2 Logistic回归
7.5.3 决策树
7.5.4 支持向量机
7.5.5 模型之间的比较
7.6 总结
第8章 股票市场的预测
8.1 问题描述与目标
8.2 数据的获得和介绍
8.3 xts包
8.4 问题的定义
8.4.1 衡量的指标
8.4.2 使用什么变量来预测
8.5 模型的预测
8.6 如何使用评价预测值
8.7 总结
第9章 关联分析
9.1 问题描述与目标
9.2 了解数据集
9.2.1 加载数据
9.2.2 数据的初步探索
9.3 缺失值的处理
9.4 数据的转换
9.5 建立模型
9.6 结果的解释和利用
9.7 总结
第10章 推荐系统
10.1 问题描述与目标
10.2 数据描述
10.3 了解数据集
10.4 构建推荐系统
10.4.1 寻找相似的用户
10.4.2 进行推荐
10.4.3 寻找相似的电影
10.5 存在的问题
10.6 总结