近年来,大数据成为学术界和工业界的热点,其本质就是海量数据分析。海量数据的来源包括互联网、传感器、生产生活、科学观测、科学实验等。海量数据分析不仅可以帮助人们取得新的科学发现,也可以推动技术的适应性、个性化和健壮性方面的进步。海量数据分析是一个跨学科的研究领域,理解本书的内容需要具备计算机科学、统计学和优化理论的基础知识。本书从计算和推理的角度分析了与海量数据分析相关的前沿问题,重点介绍海量数据挖掘分析以及流数据挖掘的进展,讨论了并行和分布式系统架构方面的最新发展,具体内容包括数据建模、任务建模、计算复杂性问题分析、数据采样以及人工参与的数据分析方法等。