在使用Apache Hadoop设计端到端数据管理解决方案时获得专家级指导。当其他很多渠道还停留在解释Hadoop生态系统中该如何使用各种纷繁复杂的组件时,这本专注实践的书已带领你从架构的整体角度思考,它对于你的特别应用场景而言是必不可少的,将所有组件紧密结合在一起,形成完整有针对性的应用程序。为了增强学习效果,《Hadoop应用架构(影印版 英文版)》第二部分提供了各种详细的架构案例.涵盖部分常见的Hadoop应用场景。无论你是在设计一个新的Hadoop应用还是正计划将Hadoop整合到现有的数据基础架构中,《Hadoop应用架构(影印版 英文版)》都将在这整个过程中提供技巧性的指导。使用Hadoop存放数据和建模数据时需要考虑的要素 在系统中导入数据和从系统中导出数据的实践指导 数据处理的框架,包括MapReduce、Spark和Hive 常用Hadoop处理模式,例如移除重复记录和使用窗口分析 Giraph,GraphX以及其他Hadoop上的大图片处理工具 使用工作流协作和调度工具,例如Apache Oozie 使用Apache Storm、Apache Spark Streaming和Apache Flume处理准实时数据流 点击流分析、欺诈防止和数据仓库的架构实例