DevOps描述了开发者、质量保证人员(QA)以及系统管理员团结协作的一种工作环境,其中的合作比传统环境中的合作更紧密。人们已经认识到DevOps在软件快速部署和自动化方面的巨大价值,但是通常会忽略DevOps方法在解决整个团队协作处理系统故障时的作用。遗憾的是,开发者、QA以及系统管理员三者所掌握的故障排除技术存在不小的差距,当系统出现问题时他们往往会相互责备。本书旨在缩小这类差距并引导所有的群组进行一系列标准的故障排除实践,通过这些实践他们可以作为一个团队来处理绝大多数常见的Linux服务器问题。尽管本书介绍的主题都是系统管理领域老生常谈的话题,但是在DevOps环境中,处理网络问题、设置Web服务器以及诊断高负载问题时也能看到开发者和QA的身影,即使他们可能并没有Linux管理背景。本书不同于普通的系统管理问题诊断指南之处在于它的读者对象和专注点。本书假设读者可能不是Linux系统管理员,而是DevOps组织中一名有天赋的开发者或QA工程师,他们可能没有很多系统级的Linux经验。即便如此,如果你是一名系统管理员,本书也同样适合你。本书还包含了让高级系统管理员也能补充技能的故障排除技术—用一种易于理解的方法。在一个传统的没有DevOps原则的企业中,故障排除和开发工作都会不正常。当出现服务器问题时,如果在会话中既有开发者也有系统管理员,可以预见他们每个人都会陷入自己的角色职责当中:系统管理员仅会查看服务器资源和日志;开发者将会等待来自团队的不可避免的责备,批评他们那些或臃肿或bug丛生的代码,与此同时开发者和系统管理员都会抱怨服务器不稳定,功率不足;或者也许每个人都会调转枪口,责备QA人员没有在将产品部署到生产环境之前找到问题。实际问题一直都无法解决。