第一章 前言 001
1.1 为什么企业管理者需要了解数据科学 003
1.2 新时代的数据素养 005
1.3 数据驱动式开发 007
1.4 如何使用本书 010
第二章 商业领域中的数据科学 013
2.1 什么是数据科学 015
2.2 企业中的数据科学 036
2.3 聘请数据科学家 048
2.4 管理失败案例 067
第三章 处理现代数据 073
3.1 非结构化数据和被动收集 076
3.2 数据类型和来源 078
3.3 数据格式 079
3.4 数据库 087
3.5 数据分析软件架构 093
第四章 讲述故事和总结数据 101
4.1 选择要度量的内容 104
4.2 异常值、可视化和概要统计的局限性:一图抵千数 108
4.3 实验、相关性和因果关系 113
4.4 以一个数字进行总结 117
4.5 评估关键特征:集中趋势、扩散程度和重尾 118
4.6 总结两个数字:相关系数和散点图 128
4.7 高阶内容:拟合直线或曲线 133
4.8 统计学:如何不自欺欺人 142
4.9 高阶内容:值得了解的概率分布 158
第五章 机器学习 175
5.1 监督式学习、非监督式学习、二元分类 178
5.2 测量性能 188
5.3 高阶内容:重要分类器 198
5.4 数据结构:无监督式学习 217
5.5 边做边学:强化学习 235
第六章 了解工具 241
6.1 关于学习编码的注意事项 244
6.2 速查表 245
6.3 数据科学生态系统的组成部分 246
6.4 高阶内容:数据库查询速成课 264
第七章 深度学习和人工智能 275
7.1 人工智能概述 278
7.2 神经网络 282
7.3 自然语言处理(NLP) 296
7.4 知识库和图表 305
后记 309