Spark实战（第2版）

定　价：¥99.80

作　者：	[法] 吉恩·乔治·佩林著，林赐译
出版社：	清华大学出版社
丛编项：
标　签：	暂缺

购买这本书可以去

ISBN：	9787302596783	出版时间：	2022-03-01	包装：
开本：		页数：		字数：

内容简介

　　企业数据的分析始于读取、过滤和合并来自多个数据源的文件和数据流。Spark数据处理引擎是这方面的佼佼者，可处理各种量级的数据，其传输速度比Hadoop系统快100倍。得益于SQL的支持、直观的界面和简单的多语言API，你可轻松使用Spark，而不必学习复杂的新型生态系统。《Spark实战（第2版）》将引导你创建端到端分析应用程序。在书中，你可学习基于Java的有趣示例，包括用于处理NASA卫星数据的完整数据管道。你还可查看托管在GitHub上的有关Java、Python和Scala的代码示例，并探索、修改此代码。此外，《Spark实战（第2版）》的附录为你提供速查表，帮助你安装工具和理解特定的Spark术语。主要内容用Java编写的Spark应用程序Spark应用架构提取文件、数据库、数据流和Elasticsearch的数据使用Spark SQL查询分布式数据集阅读门槛《Spark实战（第2版）》读者不需要具备有关Spark、Scala或Hadoop的经验。

作者简介

　　Jean-Georges Perrin是-位经验丰富的数据和软件架构师。他是法国的第一位IBM Champion，并连续12年获奖，成为终身IBM Chempion。Jean-Georges Perrin 对软件工程和数据的各个方面充满热情。新项目促使他转向分布式的数据工程，在此项目中，他在混合云环境中广泛使用Apache Spark、Java和其他工具。他很自豪地成为法国第一个公认的IBM Champion，并连续12年获奖。作为获奖的数据和软件工程专家，现在，他在全球范围内都开展了业务，但重心在他所居住的美国。Jean-Georges是资深的会议演讲者和参与者，他以书面或在线媒体的形式发表文章，分享他在IT行业超过25年的经验。