第1章 数据分析与Python 语言
1.1 数据分析概述
1.1.1 数据分析方法
1.1.2 数据分析工具
1.2 数据及其来源
1.2.1 数据及其分类
1.2.2 数据的来源
1.3 Python 的初步使用
1.3.1 Python 的下载与安装
1.3.2 模块的安装与加载
1.3.3 查看帮助文件
1.3.4 编写代码脚本
1.3.5 数据读取和保存
第2章 Python 数据处理
2.1 Python 的基本数据结构
2.1.1 数字和字符串
2.1.2 元组和列表
2.1.3 字典和集合
2.2 数组、序列和数据框
2.2.1 numpy 中的数组
2.2.2 pandas 中的序列和数据框
2.3 数据抽样和筛选
2.3.1 抽取简单随机样本
2.3.2 数据筛选
2.3.3 生成随机数
2.4 生成频数分布表
2.4.1 类别数据的频数表
2.4.2 数值数据的类别化
第3章 数据可视化分析
3.1 Python 绘图基础
3.1.1 Python 的主要绘图模块
3.1.2 基本绘图函数
3.1.3 图形布局
3.1.4 图形颜色、线型和标记
3.2 类别数据可视化
3.2.1 条形图
3.2.2 瀑布图和漏斗图
3.2.3 饼图和环形图
3.2.4 树状图
3.3 数值数据可视化
3.3.1 分布特征可视化
3.3.2 变量间关系可视化
3.3.3 样本相似性可视化
3.4 时间序列可视化
3.4.1 折线图
3.4.2 面积图
3.5 合理使用图表
第4章 数据的描述分析
4.1 数据水平的描述
4.1.1 平均数
4.1.2 分位数
4.1.3 众数
4.2 数据差异的描述
4.2.1 极差和四分位差
4.2.2 方差和标准差
4.2.3 离散系数
4.2.4 标准分数
4.3 分布形状的描述
4.3.1 偏度系数
4.3.2 峰度系数
4.4 Python 的综合描述函数
第5 章 推断分析基本方法
5.1 推断的理论基础
5.1.1 随机变量和概率分布
5.1.2 统计量的抽样分布
5.2 参数估计
5.2.1 估计方法和原理
5.2.2 总体均值的区间估计
5.2.3 总体比例的区间估计
5.3 假设检验
5.3.1 假设检验的步骤
5.3.2 总体均值的检验
5.3.3 总体比例的检验
第6章 相关与回归分析
6.1 变量间关系的分析
6.1.1 变量间的关系
6.1.2 相关关系的描述
6.1.3 相关关系的度量
6.2 一元线性回归建模
6.2.1 回归模型与回归方程
6.2.2 参数的最小平方估计
6.3 模型评估和检验
6.3.1 模型评估
6.3.2 显著性检验
6.4 回归预测和残差分析
6.4.1 回归预测
6.4.2 残差分析
第7章 时间序列分析
7.1 增长率分析
7.1.1 增长率与平均增长率
7.1.2 年化增长率
7.2 时间序列的成分和预测方法
7.2.1 时间序列的成分
7.2.2 预测方法的选择与评估
7.3 简单指数平滑预测
7.4 趋势预测
7.4.1 线性趋势预测
7.4.2 非线性趋势预测
7.5 时间序列平滑
参考文献