《大数据存储:键值、容错与一致性》分为三篇,分别涉及大数据处理中的键值存储、容错存储、数据一致性三个领域。每篇首先简要介绍相关领域的基础知识、系统优化的关键技术以及主流的系统等,然后介绍作者在相关领域的部分研究成果。具体来说,在键值存储方面,介绍了动态布隆过滤器设计、哈希分组与键值分离技术相结合的存储结构设计、哈希索引与日志结构合并树相结合的索引结构设计等方面的优化方法,旨在降低读、写放大,提升读、写与范围查询的性能;在容错存储方面,介绍了纠删码的数据布局、故障数据恢复算法、源数据节点与恢复节点选择以及系统扩容等方面的优化方法,旨在降低I/O数据量与负载均衡,加速故障恢复;在数据一致性方面,介绍了RedBlue和PoR细粒度一致性模型及其使用方法,为在备份系统中安全使用低延迟的弱一致性同步、提升系统性能提供理论依据和实践基础。