基 础 篇
第1章 引言 003
1.1 商务智能简介 004
1.2 商务智能与信息社会 007
1.2.1 信息技术提升信息社会发展水平 007
1.2.2 商务智能是信息社会的产物 010
1.2.3 商务智能是信息社会繁荣的推动力 011
1.3 商务智能与企业管理 013
1.3.1 商务智能在企业管理中的作用 013
1.3.2 商务智能协助企业管理的方式 014
1.3.3 商务智能的商业价值 015
1.4 商务智能的方法 016
1.5 商务智能的数据 019
小结 020
思考与练习 021
第2章 商务智能应用 022
2.1 制造领域应用 023
2.2 金融领域应用 026
2.3 通信领域应用 029
2.4 生物和医药领域应用 031
2.5 零售和营销领域应用 033
2.6 移动商务应用 036
2.7 社会化商务应用 037
小结 039
思考与练习 040
第3章 商务智能过程 041
3.1 数据库与事务处理 043
3.1.1 数据库与数据库管理系统 043
3.1.2 在线事务处理 044
3.2 数据仓库与在线分析处理 045
3.2.1 从事务处理到分析处理 045
3.2.2 数据仓库 047
3.3 企业知识发现 050
3.3.1 OLAP与知识发现 051
3.3.2 企业内部知识发现 052
3.3.3 企业外部知识发现 052
小结 054
思考与练习 054
第4章 数据平台 055
4.1 数据处理技术演进 056
4.2 数据仓库过程与体系结构 058
4.3 数据集成、提取与转换 060
4.3.1 数据提取 060
4.3.2 数据转换 062
4.3.3 数据加载 063
4.3.4 ETL设计与开发 063
4.4 数据仓库开发、管理与安全 064
4.4.1 数据仓库开发模式 064
4.4.2 数据仓库设计 066
4.4.3 数据仓库的逻辑数据模型 068
4.4.4 元数据 070
4.4.5 数据仓库的安全 072
4.5 分布式数据平台 074
4.5.1 分布式数据平台概念 074
4.5.2 分布式数据平台与功能组件 075
4.6 云数据平台 078
4.6.1 云数据平台概念 078
4.6.2 云数据平台与商务智能 079
小结 081
思考与练习 081
第5章 构建商务智能环境 083
5.1 商务智能环境 084
5.1.1 确定数据可用的能力 084
5.1.2 数据挖掘的能力 085
5.1.3 用户与系统交互的能力 085
5.2 商务智能组织 086
5.2.1 外包商务智能 088
5.2.2 内给商务智能 089
5.2.3 商务智能组织成员 090
5.3 商务智能系统 090
5.3.1 商务智能基础设施 090
5.3.2 商务智能系统软件 091
5.3.3 商务智能系统产品 094
小结 096
思考与练习 096
方 法 篇
第6章 数据预处理 099
6.1 数据预处理简介 100
6.1.1 数据预处理的原因 100
6.1.2 数据预处理的目的 102
6.1.3 数据预处理的方法 102
6.2 数据清洗 103
6.2.1 缺失数据处理 103
6.2.2 噪声数据处理 105
6.3 数据集成、规范与归纳 107
6.3.1 数据集成处理 107
6.3.2 数据规范化处理 108
6.3.3 数据归纳处理 110
6.4 数据消减 115
6.4.1 数据冗余清除 115
6.4.2 数据采样 116
6.4.3 数据立方合计 117
6.4.4 数据属性选取与生成 118
6.4.5 数据压缩 120
6.4.6 数据离散化与概念分层 121
小结 124
思考与练习 125
第7章 关联规则 126
7.1 关联规则简介 127
7.2 关联规则挖掘方法 130
7.3 关联规则兴趣性 133
7.4 关联规则知识形式扩展 136
7.4.1 广义关联规则 136
7.4.2 数量关联规则 138
7.4.3 时态关联规则 139
7.5 简单关联规则 140
小结 143
思考与练习 144
第8章 分类分析 145
8.1 分类分析简介 146
8.2 决策树分类 147
8.2.1 决策树构建 148
8.2.2 决策树剪枝 151
8.3 贝叶斯分类 153
8.3.1 贝叶斯定理 153
8.3.2 简单贝叶斯分类器 153
8.3.3 贝叶斯信念网络 155
8.4 其他分类方法 157
8.4.1 神经元网络分类 157
8.4.2 支持向量机分类 157
8.4.3 懒惰型分类器 158
8.5 分类准确率 159
8.5.1 分类准确率比较与评估 159
8.5.2 提高分类器的准确率 164
小结 165
思考与练习 165
第9章 聚类分析 167
9.1 聚类分析简介 168
9.2 相似度与距离测度 169
9.3 聚类分析方法 172
9.3.1 划分方法 172
9.3.2 层次方法 173
9.3.3 基于密度的方法 175
9.3.4 基于网格的方法 175
9.3.5 基于模型的方法 176
9.4 k-means方法 176
9.5 DBSCAN方法 179
小结 184
思考与练习 185
第10章 社会网络分析 186
10.1 社会网络的中心性 187
10.1.1 度中心性 188
10.1.2 贴近中心性 188
10.1.3 中介中心性 189
10.2 社会网络的权威 190
10.2.1 度权威 190
10.2.2 邻近权威 191
10.2.3 等级权威 192
10.3 引用社会网络 192
10.3.1 同引分析 192
10.3.2 引文耦合 193
10.4 社会网络的链接分析 193
10.4.1 PageRank算法 194
10.4.2 HITS算法 196
10.5 社会网络中的社区 198
小结 199
思考与练习 200
第11章 概率图模型 201
11.1 概率图模型简介 202
11.2 朴素贝叶斯模型 203
11.3 隐马尔可夫模型 205
11.3.1 马尔可夫过程 205
11.3.2 隐马尔可夫建模与处理 206
11.4 高斯混合模型 209
11.5 LDA模型 211
小结 214
思考与练习 215
第12章 神经元网络 216
12.1 神经元网络简介 217
12.2 前馈神经元网络 218
12.2.1 神经元 218
12.2.2 激活函数 218
12.2.3 前馈神经元网络 220
12.3 卷积神经元网络 222
12.3.1 卷积层 222
12.3.2 汇聚层 224
12.3.3 卷积神经元网络结构 225
12.3.4 典型卷积神经元网络 225
12.4 循环神经元网络 226
12.4.1 循环神经元网络基础结构 227
12.4.2 长/短期记忆网络 228
12.4.3 门控循环单元网络 230
12.5 注意力机制 231
12.5.1 多头注意力模型 232
12.5.2 自注意力模型 232
小结 234
思考与练习 234
第13章 多模态数据表征 236
13.1 文本表征 237
13.1.1 词袋模型 237
13.1.2 Word2vec模型 239
13.1.3 Doc2vec模型 240
13.1.4 主题模型 241
13.2 图像表征 243
13.3 音频表征 244
13.4 视频表征 247
小结 248
思考与练习 248
专 题 篇
第14章 信息提取与洞察 251
14.1 “大数据―小数据”问题概述 252
14.2 代表性信息提取 254
14.2.1 代表性评估测度 254
14.2.2 代表性信息提取方法 255
14.3 一致性信息提取 257
14.3.1 一致性评估测度 258
14.3.2 一致性信息提取方法 259
14.4 多样性信息提取 260
14.4.1 多样性评估测度 261
14.4.2 多样性信息提取方法 262
小结 263
思考与练习 264
第15章 关联分类 265
15.1 生成分类关联规则 266
15.2 分类关联规则剪枝 269
15.2.1 后剪枝方式 269
15.2.2 先剪枝方式 272
15.3 构建分类器 275
15.3.1 单一规则分类器 275
15.3.2 多规则分类器 277
15.4 混合型关联分类 278
15.5 GARC方法解析 278
15.5.1 GARC思路与算法框架 279
15.5.2 数据实验与方法比较 282
小结 285
思考与练习 286
第16章 不确定性知识发现 288
16.1 不确定性信息表达 289
16.2 分区中的边界问题 296
16.3 数据间的部分隶属性 300
16.4 不完整数据依赖 303
小结 307
思考与练习 307
第17章 智能推荐 309
17.1 信息推荐方法 310
17.1.1 推荐系统概述 310
17.1.2 协同过滤推荐方法 312
17.1.3 推荐系统评测指标 314
17.1.4 消费者信息搜索过程中的推荐 316
17.2 多模态信息推荐 319
17.2.1 多模态信息表征 320
17.2.2 多视图信息整合 322
17.2.3 商品推荐场景 322
17.3 序列推荐 323
17.4 捆绑推荐 325
小结 328
思考与练习 328
第18章 商务智能的经济社会影响与发展 329
18.1 商务智能与管理决策 330
18.2 商务智能的发展趋势 332
18.2.1 移动商务智能 332
18.2.2 人工智能赋能 333
18.2.3 数据安全与隐私保护 334
18.2.4 数据治理 336
小结 337
思考与练习 338
参考文献 339
索引词检索目录 362