站点可靠性工程简介

已完成

大大小小的组织已经开始意识到系统和应用的可靠性对其业务的重要性。 他们还了解到,在以市场要求的速度迭代时,要保持这种可靠性是多么困难。

站点可靠性工程 (SRE) 是应对这一挑战的一种可靠方法。 本模块介绍 SRE 的一些原则和做法。 如果你有任何操作经验(以 sysadmin、IT 专业人员、DevOps 实践者等身份),或者对 SRE 感兴趣,那么 SRE 将是一个特别有吸引力的主题。

在本模块结束时,应充分了解 SRE 是什么及其重要性。 其中涵盖了 SRE 的核心原则,以及有助于实施这些原则的一些做法。 在此过程中,我们介绍了与其他人讨论 SRE 从何而来所需的知识,以及它与其他运营做法(如 DevOps)的关系。 最后就如何通过这一宝贵的运营做法实现入门提供了一些建议。