序言
前言
作者简介
第1章 数据虚拟化导论1
1.1 引言1
1.2 商务智能世界正在改变1
1.3 虚拟化简介3
1.4 什么是数据虚拟化3
1.5 数据虚拟化与相关概念4
1.5.1 数据虚拟化与封装和信息隐藏4
1.5.2 数据虚拟化与抽象5
1.5.3 数据虚拟化与数据联合5
1.5.4 数据虚拟化与数据集成6
1.5.5 数据虚拟化与企业信息集成7
1.6 数据虚拟化的定义8
1.7 数据虚拟化的技术优势8
1.8 数据虚拟化的不同实现11
1.9 数据虚拟化服务器概述12
1.10 开放式与封闭式数据虚拟化服务器12
1.11 数据集成的其他方式13
1.12 数据虚拟化服务模型15
1.13 数据虚拟化的历史16
1.14 示例数据库:世界一流电影18
1.15 本书结构20
第2章 商务智能和数据仓库22
2.1 引言22
2.2 什么是商务智能22
2.3 管理层次与决策制定23
2.4 商务智能系统23
2.5 商务智能系统的数据存储24
2.5.1 数据仓库25
2.5.2 数据集市 27
2.5.3 数据中转区28
2.5.4 可操作数据存储29
2.5.5 个人数据存储30
2.5.6 不同类型数据存储的对比31
2.6 标准化模式、星形模式和雪花模式31
2.6.1 标准化模式32
2.6.2 非标准化模式32
2.6.3 星形模式33
2.6.4 雪花模式34
2.7 提取-转换-装载、提取-装载-转换和复制35
2.7.1 提取-转换-装载36
2.7.2 提取-装载-转换37
2.7.3 复制38
2.8 商务智能架构总览38
2.9 报告和分析的新形式39
2.9.1 运营报告和分析39
2.9.2 深度和大数据分析40
2.9.3 自助式报告和分析40
2.9.4 无限制的自组织分析40
2.9.5 360氨ǜ?1
2.9.6 探索性分析42
2.9.7 基于文本的分析42
2.10 传统商务智能系统的劣势43
2.11 总结46
第3章 数据虚拟化服务器:构造模块47
3.1 引言47
3.2 数据虚拟化服务器的高层架构47
3.3 导入源表和定义封装器48
3.4 定义虚拟表和映射50
3.5 虚拟表和映射的例子53
3.6 虚拟表和数据建模59
3.7 嵌套虚拟表和共享规范61
3.8 导入非关系数据62
3.8.1 XML和JSON文档62
3.8.2 Web服务66
3.8.3 电子表格66
3.8.4 NoSQL数据库68
3.8.5 多维数据集和MDX70
3.8.6 半结构化数据71
3.8.7 非结构化数据 74
3.9 发布虚拟表75
3.10 互联网数据模型80
3.11 可更新的虚拟表和事务管理82
第4章 数据虚拟化服务器:管理与安全85
4.1 引言85
4.2 影响度和线性分析85
4.3 源表、封装表和虚拟表的同步87
4.4 数据安全:认证与授权88
4.5 监控、管理和实施89
第5章 数据虚拟化服务器:虚拟表的高速缓存93
5.1 引言93
5.2 虚拟表的高速缓存93
5.3 什么时候使用高速缓存95
5.4 高速缓存与数据集市95
5.5 高速缓存保存在哪里96
5.6 刷新高速缓存97
5.7 完整刷新、增量刷新和动态刷新97
5.8 在线刷新与离线刷新98
5.9 高速缓存备份98
第6章 数据虚拟化服务器:查询优化技术100
6.1 引言100
6.2 查询优化的基本原理101
6.3 数据虚拟化服务器查询处理的10个阶段104
6.4 数据存储的智能等级105
6.5 通过查询替换进行优化106
6.6 下推优化107
6.7 查询扩展(查询注入)优化109
6.8 运送连接优化110
6.9 合并排序连接优化111
6.10 缓存优化111
6.11 数据优化与统计112
6.12 提示优化112
6.13 SQL覆盖优化113
6.14 处理策略的说明114
第7章 在商务智能系统上部署数据虚拟化115
7.1 引言115
7.2 基于数据虚拟化的商务智能系统115
7.3 部署数据虚拟化的优点116
7.4 部署数据虚拟化的缺点118
7.5 采用数据虚拟化的策略119
7.5.1 策略1:在现有的商务智能系统上引入数据虚拟化119
7.5.2 策略2:利用数据虚拟化开发新的商务智能系统123
7.5.3 策略3:开发新的结合源数据和转换数据的商务智能系统127
7.6 数据虚拟化的应用领域127
7.6.1 统一的数据访问127
7.6.2 虚拟数据集市128
7.6.3 虚拟数据仓库—基于数据集市130
7.6.4 虚拟数据仓库—基于生产数据库130
7.6.5 扩展数据仓库131
7.6.6 操作报告和分析131
7.6.7 操作数据仓库133
7.6.8 虚拟企业数据仓库133
7.6.9 自助服务报告和分析134
7.6.10 虚拟沙盒134
7.6.11 原型设计135
7.6.12 分析半结构化和非结构化数据135
7.6.13 一次性报告136
7.6.14 通过外部用户扩展的商务智能系统136
7.7 关于数据虚拟化的谬论138
第8章 数据虚拟化设计指南140
8.1 引言140
8.2 错误数据和数据质量140
8.2.1 错误数据的不同形式141
8.2.2 完整性规则和错误数据142
8.2.3 过滤、标记和恢复错误数据142
8.2.4 过滤错误数据的例子143
8.2.5 标记错误值示例145
8.2.6 恢复拼写错误数据示例146
8.3 复杂和不规则的数据结构148
8.3.1 没有名字的代码150
8.3.2 键值不一致150
8.3.3 重复组151
8.3.4 递归数据结构153
8.4 实现封装或映射中的转换155
8.5 分析错误数据155
8.6 不同的用户和不同的定义156
8.7 数据时间的不一致性157
8.8 数据存储和数据传输158
8.9 生产系统数据检索159
8.10 加入历史和业务数据1