第一章 引言
1.1 什么是科学方法?
1.2 什么是统计学?
1.3 统计学习需要的基础知识和技能
1.4 习题
第二章 数据和变量
2.1 变量
2.2 数据
2.3 总体、样本和抽样
2.3 1几个基本概念
2.3.2 抽样调查方法
2.4 习题
第三章 数据的展示和描述方法
3.1 制表方法
3.2 统计图
3.2.1 条形图
3.2.2 饼图
3.2.3 直方图
3.2.4 盒形图
3.2.5 茎叶图
3.2.6 散点图
3.2.7 其他的图描述法
3.3 用少量汇总数字的描述方法
3.3.1 关于数据位置的汇总统计量
3.3.2 关于数据尺度的汇总统计量
3.3.3 标准得分、标准化和离群点
3.4 习题
第四章 变量的分布
4.1 概率和概率分布
4.2 概率运算回顾
4.3 离散型随机变量的分布
4.3.1 二项分布
4.3.2 多项分布
4.3.3 超几何分布
4.3.4 Poisson分布
4.4 连续型随机变量的分布
4.4.1 均匀分布
4.4.2 正态分布
4.4.3 总体分位数和尾概率
4.5 简单概率计算例子
4.6 用小概率事件进行判断
4.7 习题
第五章 抽样分布
5.1 样本函数的分布
5.1.1 样本均值的分布
5.1.2 样本均值的性质和中心极限定理
5.1.3 样本比例的抽样分布
5.2 常用的抽样分布
5.2.1 χ2分布
5.2.2 t分布
5.2.3 F分布
5.3 非正态数据的正态化变换
5.4 统计量的一些常用函数
5.5 习题
第六章 简单统计推断:对总体参数的估计
6.1 点估计
6.2 区问估计
6.2.1 正态分布总体均值μ的区间估计
6.2.2 两个独立正态分布总体均值差μ1-μ2的区间估计
6.2.3 配对正态分布总体均值差μD=μ1一μ2的区间估计
6.2.4 总体比例(BeTnoulli试验成功概率)p的区间估计
6.2.5 如何概算调查所需的样本量
6.2.6 总体比例(Bernoulli试验成功概率)之差p1一p2的区间估计
6.3 习题
第七章 简单统计推断:总体参数的假设检验
7.1 假设检验的过程和逻辑
7.2 正态总体均值的检验
7.2.1 对一个正态总体均值μ的t检验
7.2.2 对两个正态总体均值之差μ1-μ2的t检验
7.2.3 配对正态分布总体均值差μD=μl-μ2的t检验
7.3 总体比例(Bernoulli试验成功概率)p的检验
7.3.1 一个总体比例p的检验
7.3.2 两个总体比例之差m-p2的检验
7.4 关于中位数的非参数检验
7.4.1 非参数检验简介
7.4.2 单样本的关于总体中位数(或总体α分位数)的符号检验
7.4.3 单样本的关于对称总体中位数(总体均值)的Wilcoxon符号秩检验
7.4.4 比较两独立样本总体中位数的Wilcoxon秩和检验
7.5 习题
第八章 变量之间的关系
8.1 定性变量之间的相关
8.1.1 列联表
8.1 X2检验
8.2 定量变量之间的相关
8.2.1 相关关系的图形描述
8.2.2 相关关系的数字刻画:Pearson线性相关系数
8.2.3 相关关系的数字刻画:Kendau.T相关系数
8.3 习题
第九章 经典回归和分类
9.1 回归和分类概述
9.1.1 “黑匣子”说法
9.1.2 试图破解“黑匣子”的实践
9.1.3 回归和分类的区别
9.2 线性回归模型
9.2.1 因变量和自变量均为数量型变量的情形
9.2.2 因变量是数量型变量而自变量包含分类变量的情形
9.2.3 对于回归利用交叉验证的例子
9.3 Loglstic回归
9.4 判别分析
9.5 习题
第十章 现代回归和分类:数据挖掘方法
10.1 决策树:分类树和回归树
10.1.1 分类树
10.1.2 回归树
10.2 组合方法:adaboost,bagging和随机森林
10.2.1 为什么组合?
10.2.2 Boosting
10.2.3 Bagging
10.2.4 随机森林
10.3 对于例9.6和例9.3的交叉验证结果
10.4 习题
附录:熟练使用R软件
参考文献