注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库数据库挖掘/数据仓库数据仓库与数据挖掘教程

数据仓库与数据挖掘教程

数据仓库与数据挖掘教程

定 价:¥25.00

作 者: 陈文伟 编著
出版社: 清华大学出版社
丛编项: 高等院校信息管理与信息系统专业系列教材
标 签: 数据库存储与管理

ISBN: 9787302131540 出版时间: 2006-08-01 包装: 平装
开本: 16开 页数: 279 字数:  

内容简介

  数据仓库与数据挖掘都是从数据资源提取信息和知识进行辅助决策。由于数据资源丰富,数据仓库与数据挖掘辅助决策效果十分显著。.本书系统介绍数据仓库原理、联机分析处理、数据仓库设计与开发、数据仓库的决策支持应用,数据挖掘原理、信息论的决策树方法、集合论的粗糙集方法、关联规则、公式发现、神经网络、遗传算法、文本挖掘与Web挖掘,以及数据仓库与数据挖掘的发展。..本书对数据仓库的系统介绍,在于突出决策支持的本质。对数据挖掘的各类方法均介绍了它们的理论基础和实现方法,并通过例子进行了说明。本书的特点是从数据仓库和数据挖掘的兴起与演变来说明它们的本质,通过实例来解释它们的原理,这样便于读者学习和掌握,适于本科生和研究生使用。...

作者简介

暂缺《数据仓库与数据挖掘教程》作者简介

图书目录

第1章数据仓库与数据挖掘概述1
1.1数据仓库的兴起1
1.1.1从数据库到数据仓库1
1.1.2从OLTP到OLAP3
1.1.3数据字典与元数据4
1.1.4数据仓库的定义与特点6
1.2数据挖掘的兴起7
1.2.1从机器学习到数据挖掘7
1.2.2数据挖掘的含义8
1.2.3数据挖掘与OLAP的比较8
1.2.4数据挖掘与统计学9
1.3数据仓库和数据挖掘的结合11
1.3.1数据仓库和数据挖掘的区别与联系11
1.3.2基于数据仓库的决策支持系统13
1.3.3数据仓库与商业智能14
习题16
第2章数据仓库原理17
2.1数据仓库结构体系17
2.1.1数据仓库结构17
2.1.2数据集市及其结构18
2.1.3数据仓库系统结构21
2.1.4数据仓库的运行结构22
2.2数据仓库的数据模型23
2.2.1星型模型24
2.2.2雪花模型25
2.2.3星网模型25
2.2.4第三范式26
2.3数据抽取、转换和装载27
2.3.1数据抽取27
2.3.2数据转换28
2.3.3数据装载30
2.3.4ETL工具31
2.4元数据32
2.4.1元数据的重要性32
2.4.2关于数据源的元数据33
2.4.3关于数据模型的元数据33
2.4.4关于数据仓库映射的元数据35
2.4.5关于数据仓库使用的元数据36
习题36
第3章联机分析处理38
3.1OLAP概念38
3.1.1OLAP的定义38
3.1.2OLAP准则39
3.1.3OLAP的基本概念42
3.2OLAP的数据模型43
3.2.1MOLAP数据模型43
3.2.2ROLAP数据模型45
3.2.3MOLAP与ROLAP的比较45
3.2.4HOLAP数据模型48
3.3多维数据的显示48
3.3.1多维数据的显示方法48
3.3.2多维类型结构49
3.3.3多维数据的分析视图50
3.4OLAP的多维数据分析52
3.4.1多维数据分析的基本操作52
3.4.2广义OLAP功能54
3.4.3多维数据分析实例56
3.5OLAP结构与分析工具58
  3.5.1OLAP结构58
  3.5.2OLAP的Web结构59
  3.5.3OLAP工具及评价61
习题63
第4章数据仓库设计与开发65
4.1数据仓库分析与设计65
4.1.1需求分析65
4.1.2概念模型设计67
4.1.3逻辑模型设计68
4.1.4物理模型设计73
4.1.5数据仓库的索引技术75
4.2数据仓库开发79
4.2.1数据仓库开发过程79
4.2.2数据质量与数据清洗85
4.2.3数据粒度与维度建模86
4.3数据仓库技术与开发的困难88
4.3.1数据仓库技术88
4.3.2数据仓库开发的困难92
习题93
第5章数据仓库管理和应用95
5.1数据仓库管理95
5.1.1用户使用数据仓库的管理95
5.1.2数据管理98
5.2数据仓库的决策支持与决策支持系统103
5.2.1查询与报表104
5.2.2多维分析与原因分析105
5.2.3预测未来106
5.2.4实时决策106
5.2.5自动决策107
5.2.6决策支持系统108
5.3数据仓库应用实例109
5.3.1航空公司数据仓库决策支持系统简例109
5.3.2统计业数据仓库系统114
5.3.3沃尔玛数据仓库系统116
习题118
第6章数据挖掘原理120
6.1知识发现过程120
6.1.1知识发现过程定义120
6.1.2数据挖掘对象121
6.1.3数据挖掘任务123
6.1.4数据挖掘分类125
6.1.5不完全数据处理127
6.1.6数据库的数据浓缩128
6.2数据挖掘方法和技术131
6.2.1归纳学习的信息论方法131
6.2.2归纳学习的集合论方法131
6.2.3仿生物技术的神经网络方法132
6.2.4仿生物技术的遗传算法133
6.2.5数值数据的公式发现133
6.2.6可视化技术134
6.3数据挖掘的知识表示134
6.3.1规则知识134
6.3.2决策树知识135
6.3.3知识基135
6.3.4神经网络的权值136
6.3.5公式知识136
6.3.6案例137
习题137
第7章信息论方法139
7.1信息论原理139
7.1.1信道模型和学习信道模型139
7.1.2信息熵和条件熵140
7.1.3互信息与信息增益141
7.1.4信道容量与译码准则142
7.2决策树方法143
7.2.1决策树概念143
7.2.2ID3方法基本思想144
7.2.3ID3算法145
7.2.4实例与讨论146
7.2.5C4.5方法148
7.3决策规则树方法151
7.3.1IBLE方法的基本思想151
7.3.2IBLE算法153
7.3.3IBLE方法实例155
习题161
第8章集合论方法163
8.1粗糙集方法163
8.1.1粗糙集概念163
8.1.2属性约简的粗糙集理论166
8.1.3属性约简的粗糙集方法172
8.1.4粗糙集方法的规则获取173
8.1.5粗糙集方法的应用实例174
8.2关联规则挖掘176
8.2.1关联规则的挖掘原理177
8.2.2Apriori算法的基本思想180
8.2.3Apriori算法程序183
8.2.4基于FP树的关联规则挖掘算法184
习题188
第9章公式发现189
9.1公式发现概述189
9.1.1曲线拟合与公式发现189
9.1.2启发式与数据驱动启发式191
9.2科学定律重新发现系统193
9.2.1BACON系统基本原理193
9.2.2BACON系统实例194
9.2.3BACON系统的进展196
9.3经验公式发现系统197
9.3.1FDD系统基本原理197
9.3.2FDD.1系统结构199
9.3.3FDD.1系统实例202
9.3.4FDD.2系统204
9.3.5FDD.3系统207
习题211
第10章神经网络与遗传算法213
10.1神经网络概念及几何意义213
      10.1.1神经网络原理213
      10.1.2神经网络的几何意义214
      10.1.3超曲面神经网络概念216
10.2感知机218
10.2.1感知机模型218
10.2.2感知机实例219
10.2.3感知机讨论220
10.3反向传播模型221
10.3.1BP网络结构221
10.3.2BP网络学习公式推导221
10.3.3实例分析226
10.4遗传算法228
10.4.1遗传算法基本原理229
10.4.2遗传算子231
10.4.3遗传算法简例 234
10.4.4遗传算法的特点236
10.5基于遗传算法的分类学习系统237
10.5.1概述237
10.5.2遗传分类学习系统GCLS的基本原理238
10.5.3遗传分类学习系统GCLS的应用242
习题243
第11章文本挖掘与Web挖掘245
11.1文本挖掘概述245
11.1.1文本挖掘的基本概念245
11.1.2文本特征的表示246
11.1.3文本特征的提取247
11.2文本挖掘248
11.2.1文本挖掘功能层次248
11.2.2关联分析248
11.2.3文本聚类249
11.2.4文本分类250
11.3Web挖掘251
11.3.1Web挖掘概述251
11.3.2Web内容挖掘253
11.3.3Web结构挖掘255
11.3.4Web应用挖掘258
习题261
第12章数据仓库与数据挖掘的发展262
12.1综合决策支持系统262
  12.1.1从管理科学到决策支持系统262
  12.1.2基于数据仓库的决策支持系统与传统决策支持系统的结265
  12.1.3综合决策支持系统发展趋势268
12.2可拓数据挖掘270
  12.2.1可拓学基本原理270
  12.2.2从数据挖掘到可拓数据挖掘272
  12.2.3可拓数据挖掘理论272
12.2.4可拓数据挖掘实例274
习题277
参考文献278

本目录推荐