实体识别在数据质量管理中起着重要作用,它是数据质量管理的重要研究方向。实体识别的目的是识别出数据集中描述同一真实世界实体的元组。实体识别的结果可以在数据质量管理的其他阶段(如数据清洗阶段和数据质量评估阶段)得到广泛应用。在一个或多个数据库中,同一个现实世界实体可能具有多种描述方式,这一问题在各种应用领域的信息系统中普遍存在。本书以信息集成和互联网搜索为背景,介绍对数据质量管理中实体识别的关键技术的 研究成果,以 化实体识别结果 度、 小化时间复杂性为目标,研究基于图模型的实体识别、基于规则的实体识别、基于距离度量的实体识别和对冗余元组中实体描述的冲突评估。本书可作为科研机构数据质量管理方面的参考用书。