前言
第1章 大数据及其应用 …… 001
1.1 大数据的特性 …… 001
1.2 数据发展历程 …… 005
1.3 数据挖掘经典算法简介 …… 013
1.4 大数据技术应用:人脸的价值 …… 027
1.5 数据存储简介 …… 030
1.6 大数据分析:应当具备的知识架构 …… 032
1.7 本章作业 …… 033
1.8 扩展:舆情来预测股票的一些细节 …… 034
第2章 分类算法 …… 036
2.1 机器学习 …… 036
2.2 两种思考模式:演绎和归纳 …… 042
2.3 分类算法的应用 …… 044
2.4 跨部门数据整合 …… 050
2.5 总结:机器看世界 …… 052
2.6 用户流失识别 …… 056
2.7 生存分析简介 …… 058
2.8 Weka简介 …… 059
2.9 本章作业 …… 066
2.10 扩展 …… 072
第3章 聚类算法 …… 078
3.1 K均值聚类算法原理 …… 078
3.2 K均值聚类的三个步骤 …… 080
3.3 分类算法vs.聚类算法 …… 087
3.4 Weka中的聚类算法 …… 088
3.5 聚类的应用 …… 089
3.6 Weka操作聚类分析的演示 …… 094
3.7 本章作业 …… 097
3.8 扩展 …… 098
第4章 网络分析 …… 101
4.1 网络分析的背景 …… 101
4.2 PageRank …… 105
4.3 应用 …… 118
4.4 网络分析 …… 124
4.5 扩展:网络关系的存储 …… 134
4.6 扩展:科技树的传承 …… 136
参考资料 …… 137
第5章 购物篮算法 …… 138
5.1 购物篮算法的原理 …… 139
5.2 评价:三个指标 …… 145
5.3 开放思考:可否把购物篮看作网络 …… 150
5.4 Weka操作关联规则的演示过程 …… 152
5.5 本章作业 …… 154
5.6 扩展 …… 155
第6章 神经网络 …… 160
6.1 四个基本型:本质是穷举 …… 160
6.2 什么是学习 …… 161
6.3 神经网络算法 …… 170
6.4 空间想象:支持向量机(SVM) …… 185
6.5 商业问题和基本型 …… 189
6.6 Weka操作神经网络分析的过程 …… 191
6.7 本章作业 …… 193
第7章 如何领导数据分析团队 …… 195
7.1 大数据/机器学习/深度学习的演变 …… 195
7.2 对管理者的启示 …… 203
7.3 本书知识回顾 …… 219