大数据需要满足基本的3V特性,即数据容量大(价值密度较低)、数据类型繁杂和时效性要求高。大容量和低价值密度特性决定了存储系统在通过分布式架构提升存储能力的同时也要格外注重数据存储的性价比,具有较低单位数据量存储价格的磁盘类设备仍旧极具竞争力。较高的时效性要求和大数据类型繁杂特性则对存储系统的高性能和适应性方面提出了更大的挑战,也预示着存储级别大数据管理在存储系统性能提升过程中的地位愈加重要。总体而言,自人类进入大数据时代,大数据存储在高性能研究领域正发生着深刻的变革,主要体现在两个大的方面:一方面是存储系统基础设施本身的性能提升,主要包括存储介质和存储体系结构的进化与改善,以及紧密依附于具体介质和架构的缓存管理、预取等核心存储技术的优化。存储系统基础设施的高性能优化体现出一种通用性和底层依赖性的特征,其核心是面向底层存储设备和存储系统的,缺乏对大数据本身结构优化的相关研究。另一方面则从大数据本身及其管理出发,研究提升存储系统性能和效率的模型与方法,由于此类研究更具针对性,其涉及的大数据种类繁多、应用类型广泛,为此本书采用具有典型大数据特征的轨迹大数据作为研究对象,并从轨迹大数据压缩和轨迹大数据检索(访问)两个与存储性能直接相关的方面出发,研究了云架构下高性能轨迹大数据压缩框架和时空融合检索算法。通过相关研究,本书构建了大数据背景下高性能存储系统与管理技术的核心研究内容体系,并给出了相应的典型研究成果,为高性能大数据存储系统的研究领域和研究方向提供了有益的借鉴。