你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

有关正式化例程和非例程任务的建议

适用于此 Azure 精心构建的框架卓越运营清单建议:

OE:02 使用文档、清单或自动化正式化运行例行公事和紧急操作任务的方式。 通过采用行业领先的做法和方法(如左移方法),努力实现团队流程的一致性和可预测性。

本指南介绍了有关正式化例程和非例程任务的建议。 高效且成功的工作负载团队具有一致且可预测的工作负载管理做法。 通过采用经过行业验证的工具和做法,以及在实际操作时自动执行流程来优化效率和一致性。 通过以一致的方式处理例行任务、临时任务和紧急任务,可以最大程度地降低出现问题时毫无准备的风险。 通过对工作负载管理采取持续改进方法,可以在整个工作负载生命周期中提高团队的一致性和效率。

关键设计策略

一致的流程使工作质量可预测,可预测的工作质量使工作负荷支持更加顺畅。 若要在进程中实现一致性,需要有意明确说明如何在标准模式中运行进程。 使用自动化和移动左移方法等策略来最大程度地减少潜在不可预测性领域。

标准化过程

流程标准化采用许多形状。 描述可能采用标准化的一切方法已脱离本指南的范围,但一些一般建议包括:

  • 标准化的过程应涵盖工作负荷管理的各个方面:可靠性、安全性、成本优化、性能和操作流程。 工作负荷团队应拥有尽可能多的流程所有权,因为它们需要维护和持续改善组织整体治理下的工作负荷。

  • 你生成的文档会捕获标准操作过程并决定如何完成操作,但文档绝不是最终的。 随着工作负荷和团队的发展,过程应不断改进。 定期审查和挑战标准,确保他们现在是团队的正确标准。 文档应进行模板化和版本控制,以确保文档格式的一致性,并且有评论和更新记录。 版本控制还有助于强化团队定期对文档进行评审的要求。

  • 将例行任务、即兴任务和紧急任务分解为易于理解的清单项。 例程任务的示例是将更新应用到开源依赖项的过程。 工作负荷可能需要使用开源库(如 SDK)来使用第三方消息服务。 对于安全修补程序、bug 修复和功能改进,应定期更新此 SDK。

    确定需要更新时,工作负荷团队可能有一个清单,其中包含诸如在较低环境中测试更新、创建更改管理请求以在生产环境中部署更新以及更新文档(如 wiki 或 知识库)以确保它们反映正确的版本。 将每个清单项集中在明确定义的离散任务上。

  • 即兴任务和紧急任务特定于方案,但操作员仍应清楚地了解其角色和职责。 他们需要知道如何与工作负荷团队和组织中的其他团队进行交互,以有效地处理这些类型的任务。

    例如,即兴任务可能会部署一种新类型的资源,例如机器学习服务,该服务已批准用于增强工作负荷功能。 对于此类资源的部署和测试,可能还没有完全实现的清单。 但是,对于将新资源作为代码模板和标准添加到基础结构时,应该有一般清单,这些标准涵盖升级链的每个阶段的性能、安全性和可靠性的基础结构测试。

    同样, 紧急响应计划 应明确定义角色和职责以及一般流程和过程。 必须在紧急情况下遵守此计划,以确保你能够有效地处理它们。

    即兴和紧急操作也是了解如何改进标准操作程序的好机会。 要求工作负荷团队反思操作可能更顺利的方式,并确定对现有流程的更新是否有利于今后。

采用行业证明的做法

  • 采用行业证明的做法,尽量减少团队在发明流程和标准上花费的时间。 遵循 Scrum 的敏捷做法,通过看板组织工作,并采用左移精神是多年来开发并证明对任何规模的组织有效的实践示例。 许多成熟的组织使用版本控制的标准操作过程、wiki、新员工手册和操作手册来强制实施一致性。

    依靠团队的经验来确定哪些做法适合工作负荷生命周期管理。 从其他团队那里了解他们已成功实施的标准,以了解特定做法如何适应组织结构。

    在此上下文中,左移的精神意味着工作负荷团队应能够寻找可提高工作负荷的安全性、可靠性和成本效益的措施。 然后,他们将这些改进措施添加到自己的积压工作,而不是将责任转移到外部团队。

    例如,探索性测试可能会发现一个改进安全性的区域,这些区域在安全扫描暴露之前可能尚未发现,这些扫描每月甚至频率更低。 鼓励工作负荷团队在其生命周期的所有方面拥有工作负荷的所有权,并主动促成其持续改进,而不是依赖其他团队。

利用集中式标准和资源

  • 将组织要求和整合的功能纳入到标准操作过程中。 对于一些流程,你的组织可能具有你应采用的标准。 但是,你可能还有权为其他流程开发自己的标准,因此寻找将所需标准纳入流程的方法。 你拥有的进程很可能与其他团队的流程相交,因此努力将标准与实际程度保持一致。

    记录工作负荷团队和其他团队流程的分歧,以确保工作负荷团队可以在有交点时与其他团队更好地合作。 中心安全团队可能使用不同于工作负荷团队的工具和过程,如果团队知道这些差异,团队可以更轻松地进行协作。

  • 将合规性要求整合到标准操作过程中。 根据你所在行业和你运营的区域,对于如何执行和记录任务,可能有严格的要求。 在构建标准时,请确保了解并整合这些要求。 定期根据这些要求训练工作负荷团队。

实现自动化

使用自动化来帮助实现一致性。 自动执行重复且容易出错的任务,以减轻团队的管理负担。 例如,寻找自动化流程的机会,例如生成 ITSM 票证。 有关详细信息,请参阅 实现自动化的建议。

治理开放源代码使用

有意采用开源方法。 规范允许使用开源工具时的规则,并确保符合组织和合规性要求。 你可能想要创建有关工作负荷团队成员对开源项目的贡献的标准,并决定是否将内部代码打开给组织中的其他开发团队。

权衡:编码标准操作程序可能导致停滞或自满的风险。 应遵循标准,但它们不应是刚性或静态的。 努力在严格遵守与创新津贴之间找到平衡,以便流程随时间推移安全发展。

Azure 便利化

尽管没有直接促进流程和过程正式化的 Azure 产品,但Microsoft发布了有关本主题的大量指南。 使用本指南了解行业证明和建议的做法,并考虑如何将这些做法应用于工作负荷。

精心构建的框架还提供了有关流程和过程的详细指导,这些流程和过程应进行编编,以确保工作负荷和工作负荷团队按照行业标准运行。

卓越运营清单

请参阅完整的建议集。