第1篇掌握数据达人的思维
第1章定义问题3
1.1数据达人应该掌握的问题4
1.2了解数据项目失败的原因10
1.3解决重要的问题14
本章小结15
第2章何为数据16
2.1数据与信息17
2.2数据类型19
2.3数据的收集与组织方式20
2.4基本汇总统计23
本章小结24
第3章统计学思维25
3.1学会质疑26
3.2无处不在的随机波动29
3.3概率与统计34
本章小结41像数据达人一样思考和沟通目录第2篇掌握数据达人的语言
第4章质询数据45
4.1你会怎么做?47
4.2数据的来源是什么?53
4.3数据是否具有代表性?56
4.4是否缺少某些数据?57
4.5数据集的大小59
本章小结60
第5章探索数据61
5.1探索性数据分析62
5.2培养探索心态64
5.3数据是否能解答问题?65
5.4你是否能从数据中发现某些相关性?71
5.5你是否从数据中发现了新的机会?76
本章小结77
第6章检查概率78
6.1猜概率: 笔记本电脑是否感染病毒79
6.2游戏规则80
6.3概率思想实验87
6.4谨慎做出独立性假设90
6.5一切概率都是条件概率92
6.6保证概率数字有意义96
本章小结99
第7章质疑统计100
7.1统计推断的简短讨论101
7.2统计推断的过程108
7.3用于质疑统计结果的问题109
本章小结118
第3篇理解数据科学家的工具箱
第8章寻找未知分组121
8.1无监督学习123
8.2数据降维123
8.3主成分分析法(PCA)126
8.4聚类131
8.5k均值聚类133
本章小结137
第9章理解回归模型139
9.1监督学习140
9.2线性回归能做些什么142
9.3线性回归带给我们什么146
9.4线性回归的隐患149
9.5其他回归模型155
本章小结156
第10章理解分类模型157
10.1分类模型介绍158
10.2逻辑回归160
10.3决策树165
10.4集成方法169
10.5谨防陷阱172
10.6准确性的误解174
本章小结178第11章理解文本分析179
11.1文本分析的期望180
11.2文本如何变成数字182
11.3主题建模192
11.4文本分类194
11.5实际处理文本分析的细节200
本章小结203
第12章解析深度学习概念204
12.1神经网络206
12.2深度学习的应用213
12.3深度学习的实践223
12.4人工智能与你227
本章小结230
第4篇确 保 成 功
第13章注意陷阱235
13.1数据中的偏差和怪象236
13.2陷阱大清单242
本章小结247
第14章知人善任248
14.1沟通中断的7个场景249
14.2数据个性255
本章小结257
第15章未完待续259术语表263