本书系统介绍了Hadoop生态系统的核心开发技术,包括:Hadoop大数据技术概述、Hadoop开发及运行环境搭建、HDFS分布式文件系统、MapReduce分布式计算技术框架、Hadoop的文件I/O以及YARN资源管理器、Zookeeper分布式协调服务、Hadoop分布式集群搭建与管理、Hive 数据仓库和HBase分布式数据库、Hadoop生系系统常用开发技术,并通过广电收视率数据统计分析和视频网站爬虫系统开发两个实践项目,详细直观地介绍了大数据项目的开发思路及流程。 本书通俗易懂、结构清晰,内容层层递进,理论与实践相结合,通过大量的实战案例,引导读者逐步深入学习,从而全面掌握Hadoop生态系统相关技术。 本书既可作为高等院校大学本专科计算机专业的教学用书,也可作为相关技术人员的参考用书。本书配套授课电子课件,需要的教师可登录www.cmpedu.com免费注册,审核通过后下载,或联系编辑索取(QQ:2966938356,电话:010-88379739)。