本书作为《Hadoop大数据原理与应用》(本书作者编写,西安电子科技大学出版社出版)的配套实验教程,系统介绍了Hadoop生态系统中各个开源组件的相关知识和实践技能。全书分为“基础实验篇”和“拓展实验篇”两篇,共10章,涉及数据采集、数据存储与管理、数据处理与分析等大数据应用生命周期中各阶段典型组件的部署、使用和基础编程方法。“基础实验篇”内容包括部署全分布模式Hadoop集群、实战HDFS、MapReduce编程、部署ZooKeeper集群和实战ZooKeeper、部署全分布模式HBase集群和实战HBase、部署本地模式Hive和实战Hive;“拓展实验篇”内容包括部署Spark集群和Spark编程、实战Sqoop、实战Flume、实战Kafka。 本书内容翔实,案例丰富,操作过程详尽,并配有完整的立体化资源,既可作为高等院校研究生、本科生的大数据技术原理与应用课程的实验指导书,也可作为教师参考书,同时也可供相关技术人员参考。(相关资源可在西安电子科技大学出版社网站下载。)