第1章 群集系统和复合系统的设计问题 1
1.1 企业建立群集系统的理由 1
1.1.1 风险评估 2
1.1.2 成本估算 2
1.2 复合系统中出现的故障 4
1.2.1 故障检测 6
1.2.2 故障隔离 7
1.2.3 故障报告 8
1.2.4 故障封锁 9
1.2.5 发生故障后的系统重新配置 10
1.2.6 故障预测 10
1.3 数据同步 11
1.3.1 数据的惟一性 11
1.3.2 复杂性和可靠性 11
1.3.3 同步技术 12
1.4 仲裁方案 14
1.4.1 非对称仲裁 15
1.4.2 对称仲裁 15
1.4.3 表决与定额选举 16
1.5 数据高速缓存 16
1.5.1 成本与等待时间之间的权衡 17
1.5.2 高速缓存的类型 18
1.5.3 高速缓存的同步 18
1.6 超时 19
1.6.1 稳定的系统 20
1.6.2 不稳定的系统 21
1.6.3 稳定性问题 21
1.7 群集系统中的故障 22
1.7.1 误建分区故障 22
1.7.2 多实例故障 22
1.7.3 配置信息过时故障 22
1.8 小结 22
第2章 企业群集计算时使用的基本构件 24
2.1 数据存储库与基础设施服务程序 24
2.1.1 文件服务程序 24
2.1.2 数据库服务程序 25
2.1.3 邮件服务程序 27
2.1.4 名字服务程序 27
2.2 商务逻辑与应用服务程序 28
2.2.1 打包的商业解决方案 29
2.2.2 应用程序服务器 30
2.3 用户访问服务程序:Web Farm 32
2.4 计算机群集系统 34
2.4.1 分布式群集系统 34
2.4.2 并行处理 34
2.4.3 高性能计算 34
2.4.4 Sun公司的HPC群集系统 35
2.4.5 Sun Grid Engine软件 37
2.5 建立分布式应用程序所使用的技术 37
2.5.1 CORBA 37
2.5.2 JXTA 38
第3章 Sun Cluster 3.0的体系结构 39
3.1 系统体系结构 39
3.1.1 企业信息处理系统的基础结构 40
3.1.2 Service Point体系结构 40
3.1.3 容错系统 40
3.1.4 高可用性与重大故障的恢复 41
3.1.5 被删除和被破坏的数据的恢复 43
3.2 内核的基础结构 43
3.2.1 内核框架 44
3.2.2 复制拷贝的管理 46
3.2.3 小型事务处理 46
3.3 系统特性 47
3.3.1 存储器拓扑 47
3.3.2 群集系统设备的连接 50
3.3.3 全局设备 51
3.3.4 全局文件服务系统 53
3.3.5 全局网络服务 62
3.3.6 专用互连 64
3.3.7 群集系统的配置控制 67
3.4 群集系统的故障 69
3.4.1 故障检测 69
3.4.2 可恢复的故障 72
3.4.3 无法恢复的故障 73
3.4.4 故障的报告 74
3.5 同步问题 74
3.5.1 数据服务程序和应用程序代理 75
3.5.2 并行服务程序 80
3.6 仲裁 80
3.6.1 群集系统的成员 80
3.6.2 CMM的重新配置进程 82
第4章 管理服务器 86
4.1 设计目标 87
4.2 管理服务器提供的服务 88
4.3 控制台提供的服务程序 88
4.3.1 JumpStart 88
4.3.2 综合性群集系统节点的消息 89
4.3.3 AnswerBook2文档服务器 89
4.3.4 Sun Management Center Server 89
4.3.5 Solaris Management Console 90
4.3.6 NTP服务器 91
4.4 Sun Ray服务器 92
4.5 Sun StorEdge SAN冲浪器 92
4.6 Sun Explorer数据收集器 93
4.7 Sun远程服务程序 93
4.8 软件栈 94
4.9 硬件部件 94
4.10 网络配置 95
4.11 系统管理 96
4.12 备份. 还原和恢复 96
4.12.1 管理服务器 96
4.12.2 磁带备份 97
4.12.3 CD和DVD 97
4.12.4 直接连接的磁带驱动器 97
4.12.5 Web Start Flash技术 97
4.12.6 JumpStart软件 98
4.13 小结 98
第5章 实例研究1—文件服务器群集
系统 99
5.1 对Firm公司的描述 99
5.2 设计目标 99
5.2.1 业务要求 99
5.2.2 对服务器的要求 100
5.2.3 群集系统的服务 100
5.2.4 预期的服务水平 100
5.2.5 设计优先级 101
5.3 群集系统软件 102
5.4 推荐的硬件配置 106
5.4.1 管理服务器 107
5.4.2 节点 107
5.4.3 引导环境 108
5.4.4 共享存储器 108
5.4.5 网络与互连 109
5.4.6 环境 111
5.4.7 数据的备份. 还原和恢复 112
5.5 小结 114
第6章 实例研究2—数据库群集系统 115
6.1 对Company公司的描述 115
6.2 信息技术部门 116
6.3 设计目标 116
6.4 业务要求 118
6.5 系统要求 119
6.5.1 必要的服务系统 119
6.5.2 期望达到的服务水平 119
6.6 设计优先级 120
6.6.1 可用性 120
6.6.2 可靠性 121
6.6.3 可服务性 121
6.6.4 安全性 121
6.6.5 恢复 122
6.6.6 成本 122
6.6.7 性能 122
6.7 群集系统软件 122
6.7.1 仲裁 124
6.7.2 锁的控制权 125
6.7.3 加入群集系统的节点 125
6.7.4 退出群集系统的节点 125
6.7.5 崩溃的恢复 126
6.7.6 自动重新分配锁的控制权 126
6.7.7 同步 126
6.7.8 本地GCS锁定方式与全局GCS琐定
方式 127
6.7.9 数据的高速缓存汇聚的举例 127
6.8 推荐使用的硬件配置 129
6.8.1 管理服务器 129
6.8.2 节点 130
6.8.3 引导环境 133
6.8.4 共享存储器 136
6.8.5 网络互连 139
6.8.6 环境要求 141
6.8.7 备份. 还原和恢复 143
6.9 小结 144
附录A Sun Cluster 3.0的设计检查表 145
附录B Sun Cluster技术的发展历史
和发展前景 151
附录C 数据中心设计的指导原则 162
附录D 工具 171
术语表 181
参考文献 189