目 录
第1章 应用运维\t001
1.1 初识应用运维\t001
1.2 应用运维,保障企业应用稳定运行的关键\t002
1.3 演进过程\t004
1.3.1 软件性能工程\t004
1.3.2 应用性能管理\t006
1.3.3 网站可靠性工程\t007
1.3.4 业务流程性能监控管理\t008
1.3.5 用户数字体验监控\t008
第2章 智能运维\t011
2.1 初识智能运维\t011
2.2 智能运维,赋予企业运维更强悍的大脑\t012
2.3 演进过程\t013
2.3.1 IT运维分析\t014
2.3.2 事件关联分析\t015
2.3.3 自动化运维\t015
2.3.4 人工智能运维\t015
2.3.5 开发运维一体化\t017
第3章 智能、互联时代的应用运维\t019
3.1 应用演进趋势\t020
3.2 技术演进趋势\t026
3.3 应用智能运维系统:企业数字战略的关键支撑\t028
3.4 商业价值评估(ROI分析)\t030
3.5 系统关键能力\t039
?
第4章 应用运维智能化的关键技术\t044
4.1 异常检测:筛选时间序列数据,发现潜在风险\t045
4.1.1 技术简介\t045
4.1.2 深入浅出应用实践\t047
4.1.3 应用案例\t053
4.2 关联分析:实现全景化应用监控的基础\t056
4.2.1 技术简介\t056
4.2.2 深入浅出应用实践\t056
4.3 数据统计:敏捷高效的信息提取手段\t058
4.3.1 技术简介\t058
4.3.2 深入浅出应用实践\t062
4.4 预测分析:使应用性能风险防患未然\t065
4.4.1 技术简介\t065
4.4.2 深入浅出应用实践\t065
4.5 因果推理:专家经验辅助决策支持\t067
4.5.1 技术简介\t067
4.5.2 深入浅出应用实践\t069
4.6 自治控制:应用运维过程的自动化管理\t072
4.6.1 技术简介\t072
4.6.2 深入浅出应用实践\t074
第5章 应用智能运维工具图谱\t079
5.1 开源工具\t080
5.1.1 业务流程巡检拨测\t080
5.1.2 应用请求链路追踪\t084
5.1.3 存储海量监控数据\t089
5.1.4 机器数据检索分析\t093
5.1.5 人工智能算法支撑平台\t094
5.1.6 应用监控数据可视化\t102
5.1.7 告警及风险智能管理\t111
5.2 商业化产品\t114
5.2.1 Dynatrace:软件智能平台\t114
5.2.2 AppDynamics:思科的战略新方向\t115
5.2.3 NewRelic:让应用运维随需即取\t116
5.2.4 RealSight APM:全景化应用智能管理\t118
5.2.5 Datadog:深度分析应用性能\t119
5.2.6 BigPanda:AIOps算法驱动应用自动化运维\t121
5.2.7 Numenta NuPIC:类脑计算践行异常检测\t122
第6章 立足实际需求,规划系统落地方案\t124
6.1 前期准备\t125
6.1.1 需求准备:理解企业现有的应用运维过程\t125
6.1.2 应用准备:为目标应用的运行状态准确画像\t129
6.1.3 人员准备:组建技术和管理专家团队\t132
6.1.4 技术准备:储备运维智能化的关键技术\t133
6.2 规划设计\t138
6.2.1 围绕运维现状,规划建设愿景\t138
6.2.2 多部门协作,规划服务质量目标\t141
6.2.3 制订监控策略,设计SLO计算算法\t141
6.2.4 专注过程,规划有效的风险管理机制\t142
6.3 概念验证\t143
6.3.1 围绕核心业务,验证用户数字体验监控方案\t144
6.3.2 验证应用全栈监控数据采集技术\t145
6.3.3 验证业务流程监控的可行性\t146
6.3.4 验证趋势预测算法的可行性\t147
6.3.5 验证根源问题分析算法的可行性\t148
第7章 从零开始搭建应用智能运维系统\t152
7.1 目标应用场景的定义\t152
7.1.1 目标应用介绍\t153
7.1.2 建设愿景规划\t153
7.1.3 应用运维现状\t154
7.2 规划设计\t157
7.2.1 逻辑架构\t158
7.2.2 部署架构\t159
7.3 应用全栈监控数据采集\t160
7.3.1 用户侧用户数字体验数据采集\t163
7.3.2 应用可用性数据采集\t167
7.3.3 业务流程数据采集\t174
7.3.4 应用运行环境状态数据采集\t188
7.4 搭建数据湖,存储运维大数据\t189
7.4.1 时间序列指标数据存储\t191
7.4.2 应用代码链路数据存储\t193
7.4.3 链路、拓扑图等关系数据存储\t194
7.4.4 数据湖存储与检索能力融合\t196
7.5 实现全景视图的监控数据可视化\t199
7.5.1 业务优先的应用全景可视化仪表盘\t200
7.5.2 定义级联可视化人机交互界面\t202
7.5.3 选择监控指标,定义告警策略\t204
7.6 算法驱动,实现应用风险态势感知\t207
7.6.1 时间序列监控指标的趋势预测\t207
7.6.2 建立实时智能的异常检测能力\t208
7.6.3 通过因果推理分析定位风险根源\t214
7.7 应用风险告警的智能化管理\t219
7.7.1 搭建智能化的告警管理框架\t221
7.7.2 遍在数据接入,随时回溯数据、解释告警\t223
7.7.3 智能合并告警,有效管理风险\t224
7.7.4 应用风险根源分析的智能化\t228
7.7.5 手机端主动探伤检测,防患未然\t236
第8章 典型应用场景实践\t238
8.1 开发运维一体化场景\t238
8.1.1 需求背景\t238
8.1.2 解决方案\t239
8.2 应用运行环境的稳定性性能保障\t240
8.2.1 需求背景\t240
8.2.2 解决方案\t241
8.3 基于微服务架构的应用性能监控\t243
8.3.1 需求背景\t243
8.3.2 解决方案\t245
8.4 基于大数据架构的应用运维智能化\t249
8.4.1 需求背景\t249
8.4.2 解决方案\t250
8.5 遍在接入的云应用运维智能化\t252
8.5.1 需求背景\t252
8.5.2 解决方案\t254
8.6 互联网应用的用户数字体验保障\t255
8.6.1 需求背景\t255
8.6.2 解决方案\t256
8.7 物联网应用运维场景\t260
8.7.1 需求背景\t260
8.7.2 解决方案\t261
8.8 车联网应用运维智能化\t267
8.8.1 需求背景\t267
8.8.2 解决方案\t271
8.8.3 应用案例\t274
8.9 应用运行环境的异常检测\t275
8.9.1 需求背景\t275
8.9.2 解决方案\t276
8.10 应用网络质量的预测与分析\t277
8.10.1 需求背景\t277
8.10.2 解决方案\t278
第9章 行业案例实践\t280
9.1 网联汽车\t280
9.1.1 建设背景\t280
9.1.2 解决方案\t280
9.1.3 建设效果\t282
9.2 能源电力\t283
9.2.1 建设背景\t283
9.2.2 解决方案\t284
9.2.3 建设效果\t284
9.3 广电传媒\t285
9.3.1 建设背景\t285
9.3.2 解决方案\t285
9.3.3 建设效果\t286
9.4 数字医疗\t287
9.4.1 建设背景\t287
9.4.2 解决方案\t288
9.4.3 建设效果\t289
9.5 电子政务\t290
9.5.1 建设背景\t290
9.5.2 解决方案\t291
9.5.3 建设效果\t292
9.6 银行保险\t293
9.6.1 建设背景\t293
9.6.2 解决方案\t294
9.6.3 建设效果\t294
9.7 食品快消\t295
9.7.1 建设背景\t295
9.7.2 解决方案\t296
9.7.3 建设效果\t296