可靠性支柱概述

行业良好架构的可靠性支柱主要是确保工作负荷可复原,即使在面临各种中断或故障时也能无缝运行。 它包括最大限度地减少停机时间,减少中断对用户的影响,以及确保业务连续性。

可靠性支柱包括以下关键领域:

  1. 基础:设计支持高可用性和容错的强大基础。 包括以下操作:

    • 使用多个可用性区域
    • 实现网络和数据冗余
    • 为故障而设计
  2. 变更管理:实施变更管理实践,以最大限度地降低系统变更造成的中断风险。 包括以下操作:

    • 使用自动化部署更改
    • 实施测试和验证流程
    • 使用金丝雀或蓝绿部署技术
  3. 故障管理:针对故障设计,实施检测、响应和从故障恢复流程。 包括以下操作:

    • 实施自动监视和警报
    • 使用故障隔离技术
    • 实施灾难恢复和业务连续性计划
  4. 可伸缩性:设计能够伸缩以满足不断变化的需求的解决方案。 包括以下操作:

    • 使用自动缩放
    • 为灵活性而设计
    • 实施容量计划和管理流程

行业云解决方案基于 Azure、Power Platform、Microsoft 365 和 Dynamics 365 构建。 基础结构即服务 (IaaS)、平台即服务 (PaaS) 和服务型软件 (SaaS) 组件对可靠性支柱的责任划分各不相同。 下表汇总了责任的划分:

服务的类型 Microsoft 责任 客户责任 Microsoft Cloud 行业解决方案中使用的一些组件
本地 不可用 负责整个堆栈。 本地数据网关
IaaS 确保底层基础结构的可用性和可靠性,如物理服务器、存储和网络组件。 配置和部署应用程序以最大限度地提高其可靠性和可用性。 它包括确保应用程序经过适当的构建,可以处理故障场景,如使用负载均衡和自动缩放功能。 Azure 虚拟网络 (VNet)、Azure 虚拟机 (VM)
PaaS 确保平台的可靠性,包括运行时环境和相关服务,如数据库和消息系统。 配置和部署其应用程序以最大限度地提高可靠性和可用性,如使用负载均衡和故障转移机制。 Power Platform、Azure Health Data Services、Azure 存储服务、Azure 分析服务、Azure 逻辑应用、Azure Kubernetes 服务 (AKS)
SaaS 确保整个软件应用程序和相关服务的可靠性。 包括确保应用程序可用并对用户做出响应,并确保处理后的数据安全可靠地存储。 配置其用户帐户和访问控制,以确保用户可以根据需要访问应用程序,并及时向 Microsoft 报告任何问题。 Dynamics 365、Microsoft 365

另请参见

EOF