第一章 信息技术简史 1
1.1 简介 1
1.2 IT简史 2
1.2.1 企业信息筒仓 5
1.3 数据仓库是什么 9
1.4 回答业务问题 12
1.5 企业数据模型 13
1.6 方法学概述:范围, 引导, 生产 15
1.6.1 螺旋过程 17
1.6.2 快速应用程序开发 18
1.7 数据仓库体系结构 18
1.8 信息工人访问 20
1.9 问题 22
1.10 项目 22
第二章 业务和IT在数据仓库上的结合 24
2.1 简介 24
2.2 开发教程 26
2.3 重组业务过程 33
2.4 业务与IT相结合 37
2.4.1 位置评估 38
2.4.2 能力位置 39
2.4.3 情况评估 40
2.4.4 价值链评估 40
2.5 灵活的IT部门 41
2.6 开放系统 44
2.7 ROI和论证 46
2.8 IT服务管理 49
2.9 问题 51
2.10 项目 52
第三章 如何规划和建立数据仓库 55
3.1 简介 55
3.2 企业需求分析 58
3.3 IT就绪性评价 62
3.4 项目选择 63
3.5 仓库概念体系结构 65
3.6 仓库逻辑体系结构 70
3.7 仓库物理体系结构 71
3.8 数据体系结构 73
3.9 实现 75
3.10 问题 78
3.11 项目 79
第四章 项目选择和范围 81
4.1 简介 81
4.2 企业需求发现:经理会谈 82
4.3 企业需求定义:JAD会议 85
4.4 范围和估计 88
4.5 规划 90
4.5.1 定义项目 90
4.5.2 规划项目 91
4.5.3 管理项目 93
4.6 小组成员及其技能 94
4.7 问题 97
4.8 项目 97
第五章 数据构模 100
5.1 简介 100
5.2 企业数据构模 102
5.2.1 合理的企业数据模型 104
5.3 星形方案分析:创建维模型 105
5.3.1 模型开发方法 106
5.3.2 粒度 107
5.3.3 时间 108
5.3.4 事件 109
5.4 开发维模型 109
5.5 雪花形模型 111
5.6 物理构模 112
5.7 维数据构模的十条戒律 114
5.8 金字塔的两个方面:事务ER和分析星形 114
5.9 问题 117
5.10 项目 117
第六章 元数据库 120
6.1 简介:什么是元数据 120
6.2 元数据用法模型 123
6.2.1 实现时元数据 123
6.2.2 主动运行时元数据 123
6.2.3 被动运行时元数据 124
6.3 元数据空间模型 125
6.3.1 活动元数据 125
6.3.2 位置元数据 126
6.3.3 实体元数据 126
6.3.4 人群元数据 127
6.3.5 动机元数据 127
6.3.6 时间元数据 128
6.3.7 元数据俘获和维护 129
6.3.8 初始元数据创建 129
6.3.9 大型仓库或多主题区域元数据 129
6.4 信息用户向导 130
6.5 问题 131
6.6 项目 132
第七章 在数据仓库中获得高质量信息 133
7.1 简介 133
7.2 高质量信息的值 135
7.3 获得高质量数据的困难 137
7.4 评价高质量数据价值的方法 138
7.5 应该达到何种质量 139
7.6 评价数据的方法 139
7.7 评价数据的工具 140
7.8 数据评价或审核 141
7.9 问题 142
7.10 项目 143
第八章 概念和逻辑数据仓库 145
8.1 简介 145
8.2 为什么以原则为中心 146
8.3 元原则:关于原则的原则 147
8.4 原则 148
8.4.1 一般原则 148
8.4.2 数据原则 149
8.4.3 查询原则 150
8.4.4 工作仓库原则 150
8.4.5 元数据原则 150
8.4.6 可缩放性原则 152
8.4.7 仓库管理原则 153
8.4.8 体系结构原则和Zachman框架 154
8.4.9 体系结构原则小结 155
8.5 概念模型 155
8.5.1 无规划的决策支持 156
8.5.2 虚拟数据仓库 156
8.5.3 主题区域的语义集成 157
8.5.4 查询管理主题区域 158
8.5.5 单一仓库 159
8.5.6 标准数据存档 159
8.6 体系结构选择 160
8.6.1 无规划的决策支持 161
8.6.2 虚拟数据仓库 161
8.6.3 主题区域的语义集成 162
8.6.4 查询管理主题区域 162
8.6.5 单一仓库 162
8.6.6 标准数据存档 162
8.7 逻辑模型 163
8.8 问题 165
8.9 项目 165
第九章 物理数据仓库 169
9.1 简介 169
9.2 物理存储 170
9.3 数据库因素 175
9.4 数据库服务器硬件 177
9.5 操作系统 182
9.5.1 性能 182
9.5.2 可恢复性 183
9.5.3 集成度 183
9.5.4 安全性 183
9.5.5 可管理性 183
9.6 查询服务器和应用程序服务器 184
9.7 网络和连接 184
9.8 中间件 185
9.8.1 Usage Tracker 185
9.8.2 Intelligent Warehouse 185
9.8.3 事务处理监视程序 186
9.8.4 中间件选择 186
9.9 知识工程工作站 186
9.10 部署体系结构 187
9.11 问题 190
9.12 项目 191
第十章 数据转换 193
10.1 简介 193
10.2 规划 193
10.3 数据提取和移动方法 195
10.4 数据转换 197
10.5 数据加载 199
10.6 问题 201
10.7 项目 201
第十一章 数据访问 203
11.1 简介 203
11.2 工具选择 203
11.2.1 信息用户类型 204
11.2.2 所有的FLAP 205
11.2.3 厂商选择准则 205
11.3 信息发布 206
11.4 Web访问 207
11.5 电子表格 208
11.6 可视化工具 211
11.7 查询工具 214
11.7.1 技术功能 214
11.7.2 查询功能 214
11.7.3 显示功能 215
11.7.4 接口功能 215
11.8 EIS和DSS工具类型 220
11.9 数据挖掘简介 221
11.10 问题 222
11.11 项目 223
第十二章 数据挖掘 224
12.1 简介 224
12.2 数据准备 225
12.3 神经网络 228
12.4 基因算法 232
12.5 群集和分类 233
12.6 决策树 234
12.7 统计学 236
12.7.1 回归模型 236
12.7.2 判别式分析 236
12.8 软件产品 237
12.9 软件举例 238
12.10 问题 241
12.11 项目 241
词汇表 243