第1章 发掘数据金矿的工具:
BI与DW、OLAP、DM 1
1.1 企业经营管理活动对
商业智能的需求 1
1.1.1 企业经营活动面临的挑战 1
1.1.2 企业决策实现过程的
信息需求 4
1.1.3 企业信息化系统的进化 5
1.2 商业智能的技术构成 7
1.2.1 什么是商业智能 7
1.2.2 商业智能的结构描述 9
1.2.3 数据挖掘和商业智能工具 11
1.2.4 商业智能工具的选择 12
1.2.5 SQL Server 2005的
商业智能构架 13
1.3 部署商业智能 14
1.3.1 商业智能如何协助
企业管理 14
1.3.2 商业智能在各领域的应用 15
1.3.3 商业智能应用实例 17
第2章 构建简单的BI应用:
福马特商业智能系统 21
2.1 设计和创建数据仓库 21
2.1.1 原始业务数据分析 21
2.1.2 设计数据仓库逻辑模型 22
2.1.3 创建foodmartsaleDW
数据仓库 23
2.2 设计和使用ETL 23
2.3 创建OLAP数据立方 27
2.3.1 定义数据源 27
2.3.2 定义数据源视图 28
2.3.3 生成多维数据集 30
2.4 创建和使用报表 34
2.4.1 创建报表 35
2.4.2 使用报表 38
2.5 实现其他前端展现 39
2.6 使用数据挖掘获取商业智能 42
2.6.1 商务需求分析 42
2.6.2 创建挖掘结构 43
2.6.3 从数据挖掘中获取
有价值的信息 44
第3章 BI分析的基石:
结构良好的数据仓库设计 47
3.1 数据的两种组织形式:
操作数据和分析数据 47
3.1.1 操作型系统和分析型
系统的分离 47
3.1.2 事务处理和分析
处理的对比 48
3.1.3 操作型数据与分析型
数据的对比 49
3.1.4 数据仓库的特点 50
3.2 数据仓库设计方法论 53
3.2.1 数据库设计与
数据仓库设计 53
3.2.2 数据仓库的架构方式
及其比较 55
3.2.3 宏观上的数据仓库设计 60
3.2.4 微观上的数据仓库设计 61
3.2.5 2种创建数据仓库的模式 62
3.2.6 技术上需要关注的
重点步骤 63
3.3 理解历史数据和分析需求 64
3.3.1 “数据驱动+用户驱动”
的设计理念 64
3.3.2 理解业务数据 64
3.3.3 确定用户对分析型
数据的需求 69
3.4 明确仓库的对象:主题和元数据 72
3.4.1 信息打包技术 73
3.4.2 理解数据仓库中的主题 77
3.4.3 理解数据仓库中的元数据 80
3.5 确定分析内容的构成:
事实及其粒度 81
3.5.1 事实、度量和事实表 82
3.5.2 事实表的设计 82
3.5.3 粒度的设计 83
3.5.4 聚合的设计 89
3.5.5 数据分割 90
3.6 规划分析的视角:维度 91
3.6.1 维度的构成 91
3.6.2 维度的特性 91
3.6.3 维度的分类 92
3.6.4 维度的层次和级别 94
3.6.5 维度的缓慢变化
特性及其处理 95
3.6.6 典型的维度设计 97
3.7 数据仓库物理模型设计 99
3.7.1 设计存储结构 99
3.7.2 设计索引策略 100
3.7.3 设计存储策略 100
3.8 数据仓库设计示例 102
3.8.1 销售数据仓库 102
3.8.2 保险业数据仓库 103
3.9 数据仓库数据库设计的心得总结 104
3.9.1 透彻理解数据
仓库设计过程 104
3.9.2 把握设计的关键环节 104
3.9.3 分离非分析数据 105
第4章 用SSIS对数据进行ETL操作 107
4.1 认识SSIS 107
4.1.1 使用SSIS的效果 107
4.1.2 SSIS的工作原理 108
4.1.3 第一个SSIS包的设计 110
4.2 SSIS关键元素的使用 118
4.2.1 包 118
4.2.2 容器 119
4.2.3 任务 126
4.2.4 优先约束 136
4.2.5 源 138
4.2.6 转换 139
4.2.7 目标 140
4.2.8 连接管理器 141
4.2.9 变量 141
4.2.10 事件处理程序 142
4.2.11 日志提供程序 143
4.3 创建一个完整的SSIS包 146
4.3.1 生成SSIS解决方案 147
4.3.2 设计控制流 148
4.3.3 设计数据连接 150
4.3.4 设计数据流 151
4.3.5 项目总结 155
4.4 包的调试 155
4.4.1 控制流的调试 156
4.4.2 数据流的调试 157
4.5 包的配置和部署 159
4.5.1 包的配置 159
4.5.2 包的部署 161
4.5.3 包的运行 162
4.6 SSIS的管理 164
4.6.1 管理SSIS服务 164
4.6.2 配置SSIS服务 165
第5章 SSIS在商业智能中的典型应用 167
5.1 SSIS在BI系统中的应用场景 167
5.1.1 合并异类数据 167
5.1.2 填充数据仓库和数据集市 167
5.1.3 数据清洗 168
5.1.4 处理过程中加入智能转换 168
5.1.5 自动化数据管理和加载 168
5.2 一个复杂的商务应用实例分析 169
5.2.1 包的构成 169
5.2.2 功能及其实现的原理分析 170
5.3 业务数据装载 175
5.3.1 商务需求及其设计思路 175
5.3.2 设计基本的功能 177
5.3.3 用循环加载全部数据 179
5.3.4 增强数据加载的灵活性 179
5.3.5 增强包的可维护性 181
5.3.6 增强包的鲁棒性 182
5.4 数据清洗 183
5.4.1 商务需求 184
5.4.2 设计思路 185
5.4.3 方案实现 185
5.5 SSIS商业智能应用总结 187
第6章 用SSAS进行OLAP操作 189
6.1 AS2005中OLAP的设计方法 189
6.1.1 自下而上的设计方法 189
6.1.2 自上而下的设计方法 190
6.1.3 两种方法的使用 191
6.2 统一维度模型 191
6.3 OLAP的操作对象:
数据立方的创建 193
6.3.1 自上而下生成Cube 194
6.3.2 自下而上生成Cube 203
6.3.3 部署Cube 207
6.4 Cube的构成及其各种操作 208
6.4.1 Cube的构成 209
6.4.2 多维数据集结构 210
6.4.3 维度用法 213
6.4.4 计算 214
6.4.5 KPI 215
6.4.6 操作 216
6.4.7 分区 217
6.4.8 透视 220
6.4.9 翻译 221
6.4.10 浏览器 224
6.5 通过OLAP进行数据分析 226
6.5.1 切片 226
6.5.2 切块 227
6.5.3 钻取 228
6.5.4 旋转 229
第7章 数据立方的增强及其应用 231
7.1 修改Cube结构 231
7.1.1 修改度量值 231
7.1.2 修改“客户”维度 232
7.1.3 修改“时间”维度 234
7.1.4 修改“产品”维度 236
7.2 加入分销事实表及其维度 238
7.3 完善新增维度 239
7.3.1 父子维度的使用 239
7.3.2 分销商维度的修改 242
7.3.3 雇员维度的修改 243
7.3.4 促销维度的修改 244
7.3.5 维度属性的特殊处理 244
7.4 设置维度与度量值组的关系 248
7.4.1 常规维度关系及其定义 249
7.4.2 引用维度关系及其定义 250
7.4.3 事实维度关系及其定义 252
7.4.4 多对多维度关系及其定义 254
7.5 增加计算 257
7.5.1 计算成员的创建 257
7.5.2 命名集的创建 260
7.5.3 其他脚本命令的创建 261
7.6 定义和使用KPI 261
7.6.1 KPI的设计 262
7.6.2 KPI的使用 265
7.7 增强操作 265
7.8 配置访问权限 267
第8章 用MDX扩展OLAP功能 269
8.1 初识MDX 269
8.1.1 MDX在多维数据集
中的角色 269
8.1.2 使用模板创建
第一个MDX 270
8.1.3 MDX与SQL比较 271
8.2 MDX的构造解析 272
8.2.1 MDX语句的
基本组成部分 272
8.2.2 成员 273
8.2.3 元组 273
8.2.4 集合 274
8.2.5 区分MDX的元素 274
8.3 MDX定义语句的使用 275
8.3.1 CREATE SUBCUBE 276
8.3.2 CREATE MEMBER 276
8.4 MDX操作语句的使用 277
8.4.1 DRILLTHROUGH 277
8.4.2 SELECT 278
8.5 MDX脚本语句的使用 278
8.5.1 CALCULATE 279
8.5.2 CASE 279
8.5.3 SCOPE 280
8.6 WITH子句及其使用 281
8.6.1 用WITH创建命名集 281
8.6.2 用WITH创建计算成员 282
第9章 用SSRS处理智能报表 283
9.1 报表基本知识 283
9.1.1 报表与商业智能 283
9.1.2 SSRS的结构 284
9.1.3 SSRS报表的3种状态 285
9.1.4 用SSRS做一个
简单的报表 286
9.2 SSRS的配置与管理 289
9.2.1 报表管理器 290
9.2.2 Reporting Services
配置工具 291
9.2.3 SQL Server外围
应用配置器 292
9.2.4 SQL Server Management
Studio 293
9.2.5 其他配置和管理工具 294
9.3 增强基本报表的功能 294
9.3.1 分组与排序 294
9.3.2 计算 297
9.3.3 参数化报表 297
9.3.4 复杂的参数化报表 299
9.4 报表生成器的使用 302
9.4.1 报表生成器的启动 302
9.4.2 报表模型的创建 302
9.4.3 即席报表的创建 306
第10章 基于SSAS的商业智能分析 309
10.1 构架商业智能系统的生命周期 309
10.2 商业智能向导 310
10.2.1 商务系统需要哪些智能? 311
10.2.2 商业智能向导的
基本使用 311
10.2.3 时间智能 313
10.2.4 账户智能 317
10.3 KPI分析 319
10.3.1 平衡计分卡(BSC)
与KPI 319
10.3.2 KPI技术在指标
衡量中的作用 320
10.3.3 KPI分析中的关键问题 321
10.4 80/20法则的分析 323
10.4.1 80/20法则 323
10.4.2 计算基本百分比 323
10.4.3 创建百分比比较表 324
10.5 用专业前端展现工具
呈现商业信息 324
10.5.1 前端展现的方法 325
10.5.2 用Excel 2007展现数据 326
10.5.3 SharePoint与
商业智能portal 336
第11章 数据挖掘体系结构与
基本使用方法 339
11.1 数据挖掘基本知识 339
11.1.1 数据挖掘与数据仓库
及商业智能 339
11.1.2 数据挖掘体系结构 341
11.1.3 数据挖掘的工具 341
11.1.4 数据挖掘过程模型 342
11.2 SQL Server数据挖掘
方案的构成 344
11.2.1 定义问题 344
11.2.2 准备数据 345
11.2.3 浏览数据 345
11.2.4 生成模型 345
11.2.5 浏览和验证模型 346
11.2.6 部署和更新模型 346
11.3 一个完整的数据挖掘过程
—线性回归算法 346
11.3.1 挖掘环境的搭建 346
11.3.2 线性回归的基本原理 348
11.3.3 使用线性回归挖掘数据 349
11.4 逻辑回归算法 356
11.4.1 基本原理 356
11.4.2 使用范例 357
11.4.3 验证数据挖掘
模型的方法 359
11.4.4 逻辑回归的参数设置 360
11.5 决策树算法 361
11.5.1 基本原理 361
11.5.2 使用范例 362
11.5.3 决策树的参数设置 363
11.6 聚类分析算法 364
11.6.1 基本原理 364
11.6.2 使用范例 365
11.7 Naive Bayes算法 366
11.7.1 基本原理 366
11.7.2 使用范例 366
11.8 关联算法 367
11.8.1 基本原理 367
11.8.2 使用范例 368
11.9 数据挖掘算法使用小结 370
第12章 用数据挖掘技术满足
商业分析需求 371
12.1 一个美丽的爱情故事 371
12.2 商业智能应用中的数据挖掘 372
12.2.1 哪些问题可以使用
Data mining 372
12.2.2 用什么挖掘技术
解决商业问题 373
12.2.3 挖掘中的非挖掘问题 374
12.3 潜在客户分析 375
12.3.1 商业需求 375
12.3.2 解决方案 375
12.3.3 挖掘结果 377
12.4 购物篮分析 378
12.4.1 商业需求 378
12.4.2 解决方案 379
12.4.3 挖掘结果 380
12.5 数据挖掘的前端展现:
Excel 2007数据挖掘插件 380
12.5.1 插件的配置 380
12.5.2 基本使用方法 381
12.6 数据挖掘不是万能的 383
参考文献 385
An organization’s ability to learn, and translate that learning into action rapidly, is the ultimate competitive advantage.
Jack Welch
Chairman, General Electric