第一部分设计:构建系统第1章分布式世界中的设计概述分布式系统的设计第2章为运营而设计为了实现平稳运营而应该具备的软件功能第3章选择服务平台物理机和虚拟机,私有云和公共云第4章应用程序架构创建Web和其他应用程序的基本组件第5章伸缩性设计模式扩增服务所用的基本组件第6章弹性设计模式创建可幸免于故障的系统的基本组件第二部分运营:运行系统第7章分布式世界中的运营分布式系统运行方式概述第8章 DevOps文化DevOps文化、历史和实践简介第9章服务交付:构建阶段如何构建服务和准备投产第1 0章服务交付:部署阶段服务如何测试、批准和投产第11章升级运行中的服务如何在不停机的情况下升级服务第1 2章 自动化创建工具和自动化运营工作第1 3章设计文档书面交流设计和意图第14章随时待命处理异常情况第1 5章灾难准备通过规划和实践强化系统第1 6章监控基础知识监控术语和策略第1 7章监控架构与实践监控组件和方法第1 8章容量规划在需要之前规划并提供附加资源第19章建立KPI通过计量和反思科学地推动行为第20章卓越运营持续改善的战略第三部分附录附录A评估附录B分布式计算和云的起源及未来附录C伸缩性术语和概念附录D模板和示例附录E推荐读物后记参考文献