前言 1
导言:混沌工程的诞生 5
第一部分 搭建舞台 13
第1章 遇到复杂系统 151.1 思考复杂性 151.2 遇到复杂性 171.3 面对复杂性 261.4 接纳复杂性 29
第2章 应对复杂系统 302.1 动态安全模型 302.2 复杂性的经济支柱模型 332.3 系统化视角 36
第3章 原则概述 373.1 混沌工程是什么 373.2 混沌工程不是什么 393.3 高级原则 413.4 原则的未来 45
第二部分 投入实战 47
第4章 Slack的灾难剧场 494.1 旧系统的混沌工程改造 494.2 灾难剧场 524.3 混沌工程的过程 534.4 过程如何演化 594.5 获得管理层支持 604.6 结果 604.7 总结 62
第5章 谷歌DiRT:灾难恢复测试 635.1 DiRT测试的生命周期 655.2 谷歌的测试范围 775.3 总结 79
第6章 微软的多样化故障和实验优先级 816.1 为什么一切都如此复杂 816.2 实验结果的类别 836.3 故障优先级 866.4 多样化的程度 876.5 大规模部署实验 906.6 总结 91
第7章 LinkedIn心中有会员 927.1从灾难中学习 937.2 细化实验目标 937.3 安全地进行大规模实验 957.4 LinkedOut实战 967.5 总结 105
第8章 采纳并演进混沌工程的
第一资本金融公司 1068.1
第一资本金融公司案例研究 1078.2 设计实验时需要注意的事项 1098.3 工具链 1108.4 团队结构 1118.5 传播 1128.6 总结 113
第三部分 人为因素 115
第9章 先见之明 1179.1 混沌工程与韧性 1189.2 混沌工程的步骤 1189.3 混沌工程实验的工具支持 1209.4 有效的内部合作 1229.5 总结 127
第10章 人类系统的混沌 12810.1 系统中的人 12810.2 工程师团队的适应能力 13010.3 付诸实践 132
第11章 决策圈中的人 14411.1 实验的原因、方法和时机 14511.2 总结 151
第12章 实验选择问题及解决方案 15212.1 选择实验 15212.2 可观测性:机会来了 15812.3 总结 160
第四部分 商业因素 163
第13章 混沌工程的投资回报率 16513.1 减少事故所带来的好处转瞬即逝 16513.2 Kirkpatrick模型 16613.3 投资回报率替代方案示例 16813.4 附带投资回报率 16913.5 总结 170
第14章 将心态、科学和混沌开放 17114.1 协作心态 17114.2 开放科学与开放源代码 17314.3 总结 176
第15章 混沌成熟度模型 17715.1 采用度 17715.2 复杂性 18215.3 总结 186
第五部分 持续演进 189
第16章 持续验证 19116.1 持续验证从何而来 19116.2 持续验证系统的类型 19316.3 持续验证示例:ChAP 19416.4 持续验证的未来用例 197
第17章 介入信息物理系统 19917.1 信息物理系统的兴起 20017.2 功能安全遇上混沌工程 20017.3 信息物理系统的软件 20317.4 混沌工程超越FMEA 20417.5 探针效应 20617.6 总结 208
第18章 当HOP遇上混沌工程 21018.1 什么是HOP 21018.2 HOP的主要原则 21018.3 HOP遇上混沌工程 21218.4 总结 215
第19章 数据库的混沌工程 21619.1 为什么我们需要混沌工程 21619.2 应用混沌工程 21819.3 检测故障 22219.4 自动化混沌工程 22319.5 总结 226
第20章 安全混沌工程的案例 22720.1 现代安全手段 22820.2 安全混沌工程与现有方法 23120.3 安全Game Day 23320.4 安全混沌工程工具示例:ChaoSlingr 23420.5 总结 236
第21章 结语 238作者简介 241译者简介 241封面简介 242