译者序
前言
致谢
作者简介
第1章 什么是数据科学
1.1 数据科学简史
1.1.1 数据收集简史
1.1.2 数据分析简史
1.1.3 数据科学的产生与发展
1.2 数据科学用于何处
1.2.1 销售和营销中的数据科学
1.2.2 数据科学在政府中的应用
1.2.3 数据科学在竞技体育中的应用
1.3 为什么是现在
1.4 关于数据科学的神话
第2章 什么是数据,什么是数据集
2.1 关于数据的观点
2.2 数据可以积累,而智慧不能
2.3 CRISP-DM
第3章 数据科学生态系统
3.1 将算法迁移至数据
3.1.1 传统数据库与现代的传统数据库
3.1.2 大数据架构
3.1.3 混合数据库世界
3.2 数据准备和集成
第4章 机器学习
4.1 有监督学习与无监督学习
4.2 学习预测模型
4.2.1 相关性不等同于因果,但它有时非常有用
4.2.2 线性回归
4.2.3 神经网络与深度学习
4.2.4 决策树
4.3 数据科学中的偏差
4.4 评估模型:泛化而不是记忆
4.5 摘要
第5章 标准的数据科学任务
5.1 谁是我们的目标客户(聚类)
5.2 这是欺诈吗(异常值检测)
5.3 你要配份炸薯条吗(关联规则挖掘)
5.4 流失还是不流失,这是一个问题(分类)
5.5 它价值几何(回归)
第6章 隐私与道德
6.1 商业利益与个人隐私
6.1.1 数据科学的道德启示:画像与歧视
6.1.2 数据科学的道德含义:创建一个全景监狱
6.2 隐私保护
6.2.1 保护隐私的计算方法
6.2.2 规范数据使用和保护隐私的法律框架
6.3 通往道德的数据科学之路
第7章 未来趋势与成功准则
7.1 医疗数据科学
7.2 智慧城市
7.3 数据科学项目准则:为什么会成功或失败
7.4 终极思考
术语表
延伸阅读
参考文献