注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库数据库设计/管理大数据质量

大数据质量

大数据质量

定 价:¥60.00

作 者: 蔡莉 朱扬勇 编著
出版社: 上海科学技术出版社
丛编项:
标 签: 计算机/网络 数据仓库与数据挖掘 数据库

ISBN: 9787547833742 出版时间: 2017-01-01 包装: 平装-胶订
开本: 16开 页数: 字数:  

内容简介

  数据作为一种基础性与战略性资源得到了广泛认 可,数据服务成为很多组织和机构日常营运和活动中 必不可少的重要环节。当下,数据质量在理论与实践 中越来越受到关注,不仅是制约数据产业发展的关键 问题,也是大数据应用研究中绕不开的重大命题。本 书汇集了国内外数据质量研究的经典理论、技术和方 法,以及*新的前沿发展趋势;首先介绍了传统数据 质量研究的各种代表性成果;接着,在此基础上,结 合大数据的特性,分析大数据时代下数据质量面临的 挑战,并详细介绍基于大数据的数据质量相关技术的 实现;*后,通过一个实际案例,提出一套完整的大 数据质量解决方案。蔡莉、朱扬勇编*的《大数据质量》可作为高等 院校相关专业高年级学生和研究生的数据质量课程教 材,以及从事数据质量研究和应用的科技工作者的参 考书。

作者简介

  蔡莉,副教授,云南大学软件学院网络工程系副系主任,中国计算机学会西南网路与MIS专委会委员,昆明市仪器仪表学会理事。在软件学院工作期间,参与和主持省级和市级等教学和科研项目20余项,总计金额为200余万元。同时,在国际会议和国内核心期刊上发表30余篇论文,多篇被EI和ISTP检索。出版教材2部,拥有3个软件著作权。2004年获得IBM优秀教师奖,2008年获得IBM奖教金,2014年获得IBM产学合作专业综合改革项目支持。朱扬勇,复旦大学教授、博士生导师,数据科学研究中心主任、上海市政府信息化专家委员会专家。致力于数据科学与技术、数据挖掘及其应用等领域。主持过国家自然科学基金、国家863项目、上海市科委重点等多项数据挖掘领域的研究课题。

图书目录

第1章 理解数据质量 ·1.1 数据质量问题 1.1.1 数据质量带来的影响 1.1.2 影响数据质量的因素 ·1.2 数据质量概述 1.2.1 数据质量定义 1.2.2 大数据时代数据质量面临的挑战 ·1.3 数据质量与信息质量 1.3.1 从数据质量到信息质量的发展历程 1.3.2 数据质量与信息质量的区别与联系 参考文献第2章 数据质量标准 ·2.1 ISO8000国际标准 2.1.1 ISO8000的历史与现状 2.1.2 ISO/TS8000—100系列概述 2.1.3 ISO/TS8000—100主数据质量 2.1.4 ISO 22745:2010概述 ·2.2 地理信息质量标准ISO19100 2.2.1 地理信息数据质量 2.2.2 地理信息数据质量评价 ·2.3 统计数据质量标准 2.3.1 国际统计数据标准概述 2.3.2 IMF、的数据公布通用标准(GDDS) 2.3.3 IMF的数据公布特殊标准(SDDS) ·2.4 科学数据质量标准 2.4.1 科学数据标准规范 2.4.2 科学数据质量框架 参考文献第3章 数据分类及数据模型 ·3.1 数据类型及分类 3.1.1 数据类型 3.1.2 数据分类 ·3.2 结构化数据模型 3.2.1 概念模型 3.2.2 逻辑模型 ·3.3 半结构化和非结构化数据模型 3.3.1 XML语言 3.3.2 半结构化数据模型——数据和数据质量(D2Q)模型 3.3.3 非结构化数据模型——四面体模型 参考文献第4章 数据质量相关技术 ·4.1 数据集成 4.1.1 数据仓库的基本概念 4.1.2 数据仓库的体系架构 4.1.3 数据仓库的元数据 ·4.2 数据剖析 4.2.1 数据剖析的方法 4.2.2 数据剖析实例 ·4.3 数据清洁 4.3.1 数据清洁概述 4.3.2 “脏”数据的来源 4.3.3 数据清洁的原理与框架 4.3.4 数据清洁工具 4.3.5 大数据环境下的数据清洁 ·4.4 数据溯源 4.4.1 数据溯源的基本概念 4.4.2 数据溯源的分类 4.4.3 数据溯源模型 4.4.4 数据溯源的方法 4.4.5 数据溯源的应用 4.4.6 大数据溯源 参考文献第5章 数据质量评估 ·5.1 数据质量维度 5.1.1 数据质量维度定义 5.1.2 常用的数据质量维度 5.1.3 其他的数据质量维度 5.1.4 质量维度度量 ·5.2 数据质量评估框架 5.2.1 DQAF框架 5.2.2 AIMQ框架 5.2.3 DQA框架 ·5.3 数据质量评估方法 5.3.1 定性评估 5.3.2 定量评估 5.3.3 综合评估 ·5.4 数据质量评估案例——媒体信息可信度质量评估 5.4.1 背景概述 5.4.2 媒体信息可信度评价指标体系 5.4.3 媒体信息可信度的综合评价模型 5.4.4 实验过程及结果分析 参考文献第6章 数据质量管理 ·6.1 质量管理 6.1.1 质量管理发展历程 6.1.2 全面质量管理 ·6.2 数据质量管理概述 6.2.I数据质量管理方法 6.2.2 数据质量知识库管理 6.2.3 MTT全面数据质量管理 ·6.3 数据质量管理团队建设 6.3.1 任命首席数据官 6.3.2 建立数据质量管理团队 ·6.4 质量管理成熟度模型 6.4.1 信息质量管理成熟度模型 6.4.2 数据质量管理成熟度模型 参考文献第7章 位置大数据中的质量研究 ·7.1 概述 7.1.1 位置大数据的来源 7.1.2 位置大数据的应用领域 ·7.2 位置大数据面临的质量问题 7.2.1 GPS轨迹数据的质量问题 7.2.2 签到数据的质量问题 7.2.3 手机定位数据的质量问题 7.2.4 智能公交IC卡数据的质量问题 7.2.5 OSM地图数据的质量问题 ·7.3 位置大数据的质量评估模型 7.3.1 GPS轨迹数据的质量评估模型 7.3.2 签到数据的质量评估模型 7.3.3 手机定位数据的质量评估模型 7.3.4 OSM地图数据的质量评估模型 7.3.5 基于云平台的位置大数据质量评估系统 ·7.4 位置大数据质量控制 7.4.1 位置大数据清洁 7.4.2 位置大数据质量控制 7.4.3 OSM地图数据质量保证 参考文献

本目录推荐