《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》作为Hadoop的入门教材,采用理论与实践相结合的方式,全面介绍了Hadoop大数据技术。它将帮助您:·使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集进行分布式计算。·使用Hadoop YARN资源管理器统一管理和调度Hadoop资源。·熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理。·洞悉编写MapReduce实际应用时的常见陷阱和高级特性。·设计、构建和管理一个专用的Hadoop集群或在云上运行Hadoop。·使用高级查询语言Pig来处理大规模数据。·利用Hadoop数据库HBase来保存和处理结构化/半结构化数据。·利用HIVE数据仓库工具对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。·利用SqoopSqoop在关系数据库以及Hadoop数据存储和处理平台进行数据导入、导出。·学会利用ZooKeeper来构建分布式系统。·学会利用Ambari来构建、管理、监控Hadoop生态的集群。《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》直接将相关行业典型案例作为实验教学内容编入,展示了如何用Hadoop解决实际行业场景中的问题,对实际操作更有针对性。《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业的大数据入门教材。