本书紧扣Hadoop 生态圈相关系统对大数据处理架构进行全方位介绍,重点围绕大数据基本概念、集群搭建、存储管理、各类数据分析计算以及可视化等方面的基本理论、方法和关键技术的介绍,通过丰富的应用案例展示了大数据的应用场景以及数据价值。全书共分10 章,分别是认识大数据、Hadoop 集群搭建、HDFS 分布式文件系统、MapReduce 分布式计算框架、ZooKeeper 分布式协调服务、HBase 分布式数据库、Hive 数据仓库、Sqoop 数据迁移、Storm 流计算和数据可视化。全书遵循“理论够用、实用第一”的原则选择内容,编排合理,表述深入浅出,所有操作命令全部按序列出,并配有解释和截图,指导性、实用性强,能使读者快速、轻松地掌握Hadoop 大数据平台运维和分析的基本技术。本书可作为高等职业教育本科、专科院校包括大数据技术与应用专业在内的电子信息类专业相关课程教材,也可作为非计算机专业通识课程教学用书以及大数据爱好者的参考读物。本书附有配套电子课件、源码、教案、教学设计等资源,读者可从中国水利水电出版社网站(www.waterpub.com.cn)或万水书苑网站(www.wsbookshow.com)免费下载。