在构建分析工具以快速获得洞察力之前,你首先需要知道如何处理实时数据。熟悉Apache Spark的开发人员通过这本实用指南,可以学习如何将该内存框架用于流数据处理。你会发现Spark(如何让你用与编写批处理作业几乎相同的方式编写流作业。两位作者Gerard Maas和Farancois Garillot将带你探索Apache Spark的理论基础知识。本书通过两个部分对比了Spark(现在支持的两种流API的差异:原始Spark Streaming库和新的结构化流API。学习基本的流处理概念并研究不同的流体系结构通过实例探讨结构化流处理;详细介绍流处理的不同方面。利用Spark流创建和操作流作业和应用程序;将Spark流与其他Spark API集成。学习高级Spark流处理技术,包括近似算法和机器学习算法。将Apache Spark与其他流处理项目进行比较,包括Apache Storm、Apache Flink和Apache Kafka Strearns。