《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。《大数据相似查询关键技术研究》共五章:第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。第4章基于相似查询的数据融合规则生成,介绍了一种基于相似查询的人在回路实体融合系统。第5章总结与展望,总结了全书的主要研究工作,并对未来的工作做出展望。