注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库数据库理论海量数据库解决方案

海量数据库解决方案

海量数据库解决方案

定 价:¥69.00

作 者: (韩)李华植 著,郑保卫,盖国强 译
出版社: 电子工业出版社
丛编项:
标 签: 数据库理论

ISBN: 9787121118838 出版时间: 2010-10-01 包装: 平装
开本: 16开 页数: 440 字数:  

内容简介

  《海量数据库解决方案》将整体内容分为两部分,在第1部分中以影响数据读取效率的所有要素为类别,对其各自的概念、原理、 特征、应用准则,以及表的结构特征、多样化的索引类型、优化器的内部作用、优化器为各种结果制定的执行计划予以详细说明,并以对优化器的正确理解为基础,提出对执行计划和执行速度产生最大影响的索引构建战略方案;在第2部分中主要介绍提高数据读取效率的具体战略方案,在这部分中介绍与数据读取效率相关的局部范围扫描的原理和具体应用方法,以及对被认为是提高数据库使用效率基础的表连接的所有类型予以详细说明。《海量数据库解决方案》系列丛书深受广大读者的喜爱已经长达10年之久,在被誉为“圣经”的同时,它已经变成了数据库用户不可或缺的必读书籍。作者竭力探求能够让IT工作者在实际工作中轻松应用并掌控的巧妙方法,提供事半功倍的海量数据库解决之道。

作者简介

  李华植,代表韩国的数据库技术先驱,集基于EA(Enterprise Architecture)的数据架构(Data Architecture)方法论之大成,在韩国最早提出了数据专家顾问的概念,现任EN-CORE CONSULTING总经理及代表顾问,曾在韩国Oracle公司担任200多家企业的技术顾问。论文:《构建海量数据系统时的RDB Performance问题解决方案》书籍:《Data Modeling&Database Design》(1995)《Oracle Server Tuning}(1995)《海量数据库解决方案》(1996)《海量数据库解决方案Ⅱ》(1998)《数据架构解决方案I》(2003)译者简介:郑保卫,于韩国国立釜庆大学信息工学系获得工学博士,现任职于韩国最权威的数据库公司EN-CORE CONSULTING,并兼任企业研究所研究员及数据库电子商务研究所主要研究员。研究方向包括数据模型设计、海量数据库解决方案、数据架构、基于数据库技术的专家智能系统、ITA/EA(Infomation Technology Architecture/Enterprise Architecture)。盖国强(网名Eygle),Oracle ACE总监,恩墨科技创始人,ITPUB论坛超级版主,远程DBA服务的倡导者和实践者,致力于以技术服务客户。著有《深入解析Orade》、《循序渐进Oracle》、《深入浅出Oracle》等书:从2010年开始,致力于《OracleDBA手记》的撰写与编辑工作,并与张乐奕共同创立了ACOUG用户组,在国内推进公益自由的Oracle技术交流活动。张乐奕(网名Kamus),恩墨科技技术总监,Oracle ACE,ITPUB数据库管理版版主。他曾先后于北京某大型软件公司、外资电信企业、咨询公司任首席DBA。后任职于北京甲骨文软件系统有限公司,高级顾问。他热切关注Oracle数据库及其他相关技术,对于Oracle数据库RAC及高可用解决方案具有丰富的实践经验,长于数据库故障诊断、数据库性能调优。他还是各类技术会议的热心分享者,2010年3月创建ACOUG用户组。崔华(网名Dbsnake),2004年开始从事DBA工作,在Oracle的安装、升级、开发、性能调整、故障处理方面有丰富的经验,对Oracle的体系结构具有深入了解:深入理解Oracle的内存结构、物理存储(各种块格式)、锁机制、优化机制等:深入了解Oracle的备份恢复机制,熟悉Oracle的各种备份方法,能够处理各种情况下的复杂数据恢复情况。崔华也是热心的技术分享者,多次在ACOUG的活动上与技术爱好者分享技术心得。

图书目录

第1部分 影响数据读取的因素
第1章 数据的存储结构和特征 1
1.1 表和索引分离型 5
1.1.1 堆表的结构 5
1.1.2 聚簇因子(Cluster Factor) 10
1.1.3 影响读取的因素 13
1.1.3.1 大范围数据读取的处理方案 14
1.1.3.2 提高聚簇因子的手段 17
1.2 索引组织表(Index-Organized Table) 19
1.2.1 堆表和索引组织表的比较 19
1.2.2 索引组织表的结构和特征 20
1.2.3 逻辑ROWID和物理猜(Physical Guess) 22
1.2.4 溢出区(Overflow Area) 24
1.2.5 索引组织表的创建 25
1.3 聚簇表 26
1.3.1 聚簇表的概念 27
1.3.2 单表聚簇 29
1.3.3 复合表聚簇 31
1.3.4 聚簇表的代价 34
1.3.5 哈希聚簇 39
第2章 索引的类型和特征 43
2.1 B-Tree 索引 44
2.1.1 B-Tree 索引的结构 44
2.1.2 B-Tree 索引的应用 47
2.1.3 反向键索引 52
2.2 位图索引 53
2.2.1 位图索引的形成背景 54
2.2.2 位图索引的结构和特征 55
2.2.3 位图索引的读取 57
2.3 基于自定义的函数索引 60
2.3.1 基于自定义的函数索引的概念和结构 60
2.3.2 基于自定义函数索引的约束 61
2.3.3 基于自定义函数索引的灵活运用 64
第3章 SQL的执行计划(Explain Plan) 74
3.1 SQL和优化器 75
3.1.1 优化器的作用和人的作用 77
3.1.2 优化器的类型 80
3.1.2.1 基于规则的优化器 82
3.1.2.2 基于成本的优化器 86
3.1.2.3 优化器目标的选择 93
3.1.2.4 执行计划的固定化方案 97
3.1.2.5 优化器的局限 103
3.1.3 优化器的最优化步骤 106
3.1.4 查询语句的转换 112
3.1.4.1 传递性规则 113
3.1.4.2 视图合并(View Merging) 116
3.1.4.3 查看用户定义的绑定变量 122
3.1.5 开发者的作用 123
3.2 执行计划的类型 126
3.2.1 扫描的基本类型 126
3.2.1.1 全表扫描 127
3.2.1.2 ROWID扫描 132
3.2.1.3 索引扫描 133
3.2.1.4 B-Tree聚簇读取(Cluster Access) 138
3.2.1.5 哈希聚簇读取(Hash Cluster Access) 139
3.2.1.6 采样表扫描(Sample Table Scan) 140
3.2.2 表连接的执行计划 143
3.2.2.1 嵌套循环连接(Nested Loops Join) 143
3.2.2.2 排序合并连接(Sort Merge Join) 146
3.2.2.3 哈希连接(Hash Join) 148
3.2.2.4 半连接(Semi Join) 149
3.2.2.5 笛卡儿连接 151
3.2.2.6 外连接(Outer Join) 154
3.2.2.7 索引连接 159
3.2.3 其他运算方式的执行计划 161
3.2.3.1 IN-List迭代执行计划 162
3.2.3.2 连锁执行计划 163
3.2.3.3 远程执行计划 165
3.2.3.4 排序操作执行计划 168
3.2.3.5 集合操作执行计划 171
3.2.3.6 COUNT(STOPKEY)执行计划 174
3.2.4 位图(Bitmap)执行计划 175
3.2.4.1 各种条件运算符的位图执行计划 176
3.2.4.2 子查询执行计划 182
3.2.4.3 与B-Tree索引相结合的执行计划 184
3.2.5 其他特殊处理的执行计划 185
3.2.5.1 递归展开(Recursive Implosion)执行计划 186
3.2.5.2 修改子查询执行计划 191
3.2.5.3 特殊类型的执行计划 193
3.3 执行计划的控制 203
3.3.1 提示的活用准则 204
3.3.2 使用提示实现最优化目标 206
3.3.3 使用提示改变表连接顺序 207
3.3.4 表连接方式选择过程中提示的使用 208
3.3.5 并行操作中提示的使用 209
3.3.6 数据读取方法选择中提示的使用 211
3.3.7 查询转换(Query Transformation)过程中提示的使用 214
3.3.8 其他提示 216
第4章 构建索引的战略方案 221
4.1 索引的选定准则 222
4.1.1 不同类型表的索引应用准则 223
4.1.2 离散度和损益分界点 227
4.1.3 索引合并和组合索引的比较 229
4.1.4 组合索引的特征 232
4.1.5 组合索引中列序的决定准则 239
4.1.6 索引选定步骤 242
4.2 决定聚簇类型的准则 263
4.2.1 全局性聚簇 263
4.2.2 局部性聚簇 265
4.2.3 单表聚簇 266
4.2.4 单位聚簇大小的决定 267
4.2.5 确保聚簇被使用的措施 270
第2部分 最优化数据读取方案
第5章 局部范围扫描(Partial range scan) 274
5.1 局部范围扫描的概念 276
5.2 局部范围扫描的应用原则 281
5.2.1 局部范围扫描的条件 281
5.2.2 不同优化器模式下的局部范围扫描 284
5.3 提高局部范围扫描执行速度的原理 285
5.4 向局部范围扫描引导的方法 289
5.4.1 利用访问路径实现对Sort的代替 289
5.4.2 只使用索引的局部范围扫描 292
5.4.3 MIN、MAX 的处理 293
5.4.4 FILTER型局部范围扫描 298
5.4.5 ROWNUM的灵活运用 300
5.4.6 利用嵌套视图的局部范围扫描 306
5.4.7 利用函数的局部范围扫描 308
5.4.8 利用查询语句二元化特性的局部范围扫描 316
5.4.9 Web留言板中的局部范围扫描 318
第6章 表连接的最优化方案 336
6.1 JOIN和LOOP QUERY的比较 339
6.1.1 全部范围扫描方式下的比较 341
6.1.2 局部范围扫描方式下的比较 349
6.2 连接条件状态对表连接的影响 351
6.2.1 连接条件正常 353
6.2.2 连接条件一边异常 358
6.2.3 连接条件两边异常 361
6.3 各种表连接方式的特征及活用方案 365
6.3.1 嵌套循环连接 366
6.3.1.1 嵌套循环连接的基本概念 367
6.3.1.2 嵌套循环连接顺序的决定 370
6.3.2 排序合并连接 379
6.3.3 嵌套循环连接和排序合并连接的比较 383
6.3.4 哈希连接(Hash Join) 387
6.3.4.1 IN-MEMORY哈希连接 392
6.3.4.2 延迟哈希连接 395
6.3.5 半连接(Semi Join) 398
6.3.5.1 半连接的概念和特征 399
6.3.5.2 半连接的执行计划 401
6.3.6 星型(Star)连接 417
6.3.7 星变形(Star Transformation)连接 425
6.3.8 位图连接索引 436

本目录推荐