你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
云策略的弹性考量
复原能力是基础结构在中断或故障的情况下保持功能和可用性的能力。 这是任何成功的云采用策略的基石。 在设计云基础结构时考虑到复原能力,以最大程度地减少中断的影响。 这样做有助于保持业务运营中的连续性和可靠性。
考虑到业务与技术越紧密集成,技术复原能力就越重要。
如果系统支持关键流程或对业务运营至关重要,任何停机都可能导致重大财务损失、资源流失,甚至完全停止业务活动。
应对意外情况
在现代格局中,停机可能导致重大财务损失和声誉损害,许多组织需要复原能力。 无论是自然灾害、网络攻击还是系统故障造成的,随时都可能发生意外中断。
复原能力是确保云基础结构和应用程序足够强大,能够应对这些挑战,最大限度地减少停机时间,并保留服务和数据的完整性。
通常,并非所有企业中的系统都需要相同的复原能力级别。 可以考虑在业务中的复原级别方面保持灵活性,以便你可以专注于最重要的复原投资。
复原能力还使组织能够保持业务连续性,满足法规要求,并通过帮助确保关键应用程序和服务在意外发生时保持可用,从而增强客户信任。
了解共同责任模型
复原能力是云提供商与其客户之间的共同责任。
共享责任模型定义了职责划分,并为提供商管理的内容(如核心云基础结构)以及客户负责的内容(例如其应用程序和数据的安全性和配置)建立边界。
记录和理解共同责任对于云采用策略至关重要,因为它可确保你了解在维护安全性、合规性和可靠性方面所扮演的角色。 通过将共享责任模型合并到策略中,可以主动应对潜在风险,确保进行适当的治理,并构建更可靠的云环境,使其符合组织目标和法规要求。
确保 Azure 上的系统可靠性是客户与云提供商之间的共同责任。 Microsoft 负责管理云平台的可靠性,而客户和合作伙伴负责管理其云应用程序和基础结构部署的可靠性。
为云采用策略提供支持
将弹性集成到云采纳策略中,可以通过提供质量控制来形成竞争优势。 通过设计具有复原能力的体系结构,可以帮助确保应用程序和业务在整个情况下运行,包括硬件或网络问题,甚至数据中心或整个云区域的丢失。 此战略重点允许更有效的资源分配、提高运营效率和更好的风险管理。
它还可以通过使组织能够快速适应市场需求,同时保持可靠的安全性和合规性态势,从而促进服务的敏捷部署。
归根结底,复原能力是云采用策略的重要组成部分,因为它推动质量和创新,并支持长期业务目标。
复原方案示例
下面是云采用策略中复原能力的重要性的几个示例,这些策略映射到特定类型的风险方案。
风险方案 | 风险影响 | 复原能力缓解措施示例 |
---|---|---|
网络攻击 | 勒索软件、分布式拒绝服务(DDoS)或未经授权的访问。 | 为了减少影响,请在采用策略和计划中包括可靠的安全措施,包括适当的备份和恢复过程。 |
系统故障 | 硬件或软件故障。 | 用于快速恢复和数据完整性还原的设计。 处理应用程序中的暂时性故障,并在基础结构中提供冗余,例如具有自动故障转移功能的多个副本。 |
配置问题 | 部署错误或配置错误。 | 使用基础结构即代码(IaC)将配置更改视为代码更改。 使用持续集成/持续部署(CI/CD)管道、金丝雀发布和回滚机制,减少错误更新或部署的影响。 |
需求高峰或重载 | 在高峰使用或流量激增期间性能下降。 | 使用弹性可伸缩性来确保系统自动缩放以处理增加的需求,而不会中断服务。 |
符合性故障 | 违反法规标准。 | 采用 Microsoft Purview 等符合性工具,并使用 Azure Policy 强制实施合规性要求。 |
自然灾害 | 地震、洪水或风暴造成的数据中心中断。 | 使用可用区、多个区域甚至多云方法来进行规划,以实现故障转移、高可用性和灾难恢复。 |
建议
请遵循这些建议,使您的云采用策略考虑到复原性注意事项。
执行业务影响分析(BIA):定义各种系统和应用程序的关键性,以帮助确定资源和恢复工作的优先级。 在整个云采用过程中以迭代方式执行此分析。
执行风险评估:确定可能影响云基础结构的潜在威胁和漏洞,并使用这些威胁和漏洞构建缓解策略,并告知复原能力和可靠性计划。
完成成本效益分析:制定并了解云采用的投资如何符合业务连续性要求和 SLA。
了解共同责任:确保策略团队包含云中共享责任模型的详细信息,包括它如何影响可靠性。 有关详细信息,请参阅 可靠性要求。
了解 Azure 可靠性:使用 Azure 可靠性文档 更好地了解 Azure 中的可靠性和复原能力的工作原理。
了解 Azure 服务的可靠性功能:查看 Azure 服务可靠性指南,以指导您为特定 Azure 服务制定可靠性采纳策略。
了解恢复目标:了解 恢复时间目标(RTO)和恢复点目标(RPO) 作为云采用策略的一部分,以了解系统的停机时间和数据丢失限制。
定义现实的可靠性目标:与内部利益干系人就可靠性设置现实预期,并使用合同协议将这些期望传达给客户。 有关定义可靠性目标 ,请参阅 Azure Well-Architected Framework建议。