可靠性支柱概述
行业良好架构的可靠性支柱主要是确保工作负荷可复原,即使在面临各种中断或故障时也能无缝运行。 它包括最大限度地减少停机时间,减少中断对用户的影响,以及确保业务连续性。
可靠性支柱包括以下关键领域:
基础:设计支持高可用性和容错的强大基础。 包括以下操作:
- 使用多个可用性区域
- 实现网络和数据冗余
- 为故障而设计
变更管理:实施变更管理实践,以最大限度地降低系统变更造成的中断风险。 包括以下操作:
- 使用自动化部署更改
- 实施测试和验证流程
- 使用金丝雀或蓝绿部署技术
故障管理:针对故障设计,实施检测、响应和从故障恢复流程。 包括以下操作:
- 实施自动监视和警报
- 使用故障隔离技术
- 实施灾难恢复和业务连续性计划
可伸缩性:设计能够伸缩以满足不断变化的需求的解决方案。 包括以下操作:
- 使用自动缩放
- 为灵活性而设计
- 实施容量计划和管理流程
行业云解决方案基于 Azure、Power Platform、Microsoft 365 和 Dynamics 365 构建。 基础结构即服务 (IaaS)、平台即服务 (PaaS) 和服务型软件 (SaaS) 组件对可靠性支柱的责任划分各不相同。 下表汇总了责任的划分:
服务的类型 | Microsoft 责任 | 客户责任 | Microsoft Cloud 行业解决方案中使用的一些组件 |
---|---|---|---|
本地 | 不可用 | 负责整个堆栈。 | 本地数据网关 |
IaaS | 确保底层基础结构的可用性和可靠性,如物理服务器、存储和网络组件。 | 配置和部署应用程序以最大限度地提高其可靠性和可用性。 它包括确保应用程序经过适当的构建,可以处理故障场景,如使用负载均衡和自动缩放功能。 | Azure 虚拟网络 (VNet)、Azure 虚拟机 (VM) |
PaaS | 确保平台的可靠性,包括运行时环境和相关服务,如数据库和消息系统。 | 配置和部署其应用程序以最大限度地提高可靠性和可用性,如使用负载均衡和故障转移机制。 | Power Platform、Azure Health Data Services、Azure 存储服务、Azure 分析服务、Azure 逻辑应用、Azure Kubernetes 服务 (AKS) |
SaaS | 确保整个软件应用程序和相关服务的可靠性。 包括确保应用程序可用并对用户做出响应,并确保处理后的数据安全可靠地存储。 | 配置其用户帐户和访问控制,以确保用户可以根据需要访问应用程序,并及时向 Microsoft 报告任何问题。 | Dynamics 365、Microsoft 365 |
另请参见
EOF