《Spark性能优化实战:突破性能瓶颈,遨游数据重洋》全面、系统、深入地介绍Apache Spark性能优化的相关技术和策略,涵盖从Spark性能优化的基础知识到核心技术,再到应用实践的方方面面。本书不但系统地介绍各种监控工具的使用,而且还结合实战案例,详细介绍Spark性能优化的各种经验和技巧,提升读者的实际应用技能。 《Spark性能优化实战:突破性能瓶颈,遨游数据重洋》共8章。第1章从性能优化的基本概念出发,介绍Spark的基础知识,并介绍如何进行性能优化;第2章介绍Spark性能优化的几个方面,包括程序设计优化、资源优化、网络通信优化和数据读写优化等;第3章深入介绍Spark任务执行过程优化;第4章介绍Spark SQL性能优化;第5章结合实战案例全面解析Spark性能优化的核心技术与应用;第6章详细介绍不同应用场景的性能优化策略;第7章介绍Spark集成Hadoop、Kafka和Elasticsearch使用时的性能优化,从而提供更实用的Spark性能提升方案;第8章介绍Spark应用程序开发与优化,以及集群管理实践。 《Spark性能优化实战:突破性能瓶颈,遨游数据重洋》内容丰富,讲解深入浅出,适合Apache Spark开发人员、数据工程师和数据科学家阅读,也适合需要处理大规模数据集和对Spark性能优化感兴趣的技术人员阅读,还可作为高等院校大数据专业的教材和相关培训机构的教学用书。