第1 章 数据分析概况 /1
1.1 数据分析定义(What) /2
1.2 数据分析作用(Why) /4
1.3 数据分析步骤(How) /5
1.3.1 明确分析目的和思路 /6
1.3.2 数据收集 /7
1.3.3 数据处理 /9
1.3.4 数据分析 /9
1.3.5 数据展现 /10
1.3.6 报告撰写 /10
1.4 数据分析的三大误区 /12
1.5 常用的数据分析工具 /13
1.5.1 Excel /13
1.5.2 SPSS /14
1.5.3 R语言 /15
1.5.4 Python语言 /16
第2 章 Python 概况 /17
2.1 Python简介 /18
2.2 Python特点 /19
2.3 Python模块 /20
2.3.1 函数 /20
2.3.2 模块 /24
2.4 Python使用场景 /27
2.5 Python 2与Python 3 /28
2.6 Python与数据科学 /29
2.7 Anaconda简介 /30
2.8 安装Anaconda /31
2.8.1 下载Anaconda /31
2.8.2 安装Anaconda /33
2.9 使用Anaconda /37
2.9.1 PyCharm 与Spyder /37
2.9.2 Anaconda 开始菜单 /38
2.9.3 Spyder 工作界面简介 /39
2.9.4 项目管理 /40
2.9.5 代码提示 /43
2.9.6 变量浏览 /44
2.9.7 图形查看 /44
2.9.8 帮助文档 /45
第3 章 编程基础 /47
3.1 数据类型 /48
3.1.1 数值型 /48
3.1.2 字符型 /50
3.1.3 逻辑型 /56
3.2 赋值和变量 /57
3.2.1 赋值和变量 /57
3.2.2 变量命名规则 /58
3.3 数据结构 /59
3.3.1 列表 /59
3.3.2 字典 /63
3.3.3 序列 /66
3.3.4 数据框 /72
3.3.5 四种数据结构的区别 /80
3.4 向量化运算 /81
3.5 for 循环 /83
3.6 Python 编程注意事项 /87
第4 章 数据处理 /90
4.1 数据导入与导出 /91
4.1.1 数据导入 /91
4.1.2 数据导出 /99
4.2 数据清洗 /100
4.2.1 数据排序 /101
4.2.2 重复数据处理 /102
4.2.3 缺失数据处理 /106
4.2.4 空格数据处理 /109
4.3 数据转换 /110
4.3.1 数值转字符 /110
4.3.2 字符转数值 /112
4.3.3 字符转时间 /113
4.4 数据抽取 /115
4.4.1 字段拆分 /116
4.4.2 记录抽取 /121
4.4.3 随机抽样 /127
4.5 数据合并 /130
4.5.1 记录合并 /130
4.5.2 字段合并 /133
4.5.3 字段匹配 /135
4.6 数据计算 /140
4.6.1 简单计算 /140
4.6.2 时间计算 /141
4.6.3 数据标准化 /142
4.6.4 数据分组 /144
第5 章 数据分析 /148
5.1 对比分析 /149
5.2 基本统计分析 /152
5.3 分组分析 /155
5.4 结构分析 /158
5.5 分布分析 /159
5.6 交叉分析 /162
5.7 RFM 分析 /164
5.8 矩阵分析 /173
5.9 相关分析 /176
5.10 回归分析 /178
5.10.1 回归分析简介 /178
5.10.2 简单线性回归分析 /180
5.10.3 多重线性回归分析 /185
第6 章 数据可视化 /189
6.1 数据可视化简介 /190
6.1.1 什么是数据可视化 /190
6.1.2 数据可视化常用图表 /190
6.1.3 通过关系选择图表 /191
6.2 散点图 /192
6.3 矩阵图 /203
6.4 折线图 /210
6.5 饼图 /215
6.6 柱形图 /217
6.7 条形图 /222