管理 Azure VM 的可用性
通常,服务公司的成功与公司和其客户签署的服务级别协议 (SLA) 直接相关。 客户期望你提供的服务始终可用并可保证他们数据安全。 此安全性是 Microsoft 非常重视的方面。 Azure 提供可用于管理可用性、数据安全和监视的工具,以便你知道你的服务始终对客户可用。
管理 Azure VM 并不局限于管理 VM 上运行的操作系统或软件。 它有助于了解 Azure 提供的哪些服务可确保服务可用性并支持自动化。 这些服务有助于规划组织业务连续性和灾难恢复策略。
在这里,我们将介绍一种 Azure 服务,它有助于提高 VM 可用性,简化 VM 管理任务并使 VM 数据保持备份和安全。 让我们从定义可用性开始。
什么是可用性?
可用性是一项服务可供使用的时间百分比。
假设你有一个网站,并且你希望客户能够随时访问所有信息。 对于网站访问,你的预期是 100% 的可用性。
为什么在使用 Azure 时需要考虑可用性?
Azure VM 运行托管在 Azure 数据中心的物理服务器。 与大多数物理设备一样,可能发生故障。 如果物理服务器出现故障,该服务器上托管的虚拟机也将发生故障。 如果出现故障,Azure 会自动将 VM 移到正常的主机服务器。 但是,这种自愈迁移可能需要几分钟,在此期间,托管在该 VM 上的应用程序不可用。
Azure 本身启动的定期更新也会影响 VM。 这些维护事件的范围从软件更新到硬件升级,并且是提高平台可靠性和性能所必需的。 这些事件通常在不影响任何来宾 VM 的情况下进行,但有时需要重启虚拟机以完成更新或升级。
可用性区域
可用性区域扩展了在保持 VM 上的应用程序和数据的可用性时的控制级别。 可用性区域是 Azure 区域中在物理上独立的区域。 每个受支持的 Azure 区域有三个可用性区域。
每个可用性区域有独立的电源、网络和散热设备。 通过将解决方案设计为使用区域中复制的 VM,可以在数据中心服务中断时保护应用和数据。 如果一个区域发生故障,另一个区域会立即提供复制的应用和数据。
虚拟机规模集
使用 Azure 虚拟机规模集可以创建并管理一组负载均衡的 VM。 可以根据需求或定义的计划自动增减 VM 实例的数目。 规模集为应用程序提供高可用性,用于集中管理、配置和更新大量 VM。 规模集本身是免费的,你只需为创建的每个 VM 实例付费。
规模集内的虚拟机还可部署到多个可用性区域、单个可用性区域或按地区进行部署。 可用性区域部署选项可能因业务流程模式而异。
负载均衡器
将 Azure 负载均衡器与可用性区域或可用性集组合在一起,以获取最高的应用程序复原能力。 Azure 负载均衡器将流量分布到多个虚拟机中。 对于标准层虚拟机来说,Azure 负载均衡器已包括在内。 并非所有虚拟机层都包括 Azure 负载均衡器。 有关对虚拟机进行负载均衡的更多信息,请阅读对 Linux 或 Windows 虚拟机进行负载均衡。
Azure 存储冗余
Azure 存储始终会存储数据的多个副本,以防范各种计划内和计划外的事件,包括暂时性的硬件故障、网络中断或断电、大范围自然灾害等。 冗余可确保即使遇到故障,存储帐户也能达到其可用性和持久性目标。
在确定最适合自己方案的冗余选项时,请考虑如何在较低成本与较高可用性之间做出取舍。 可帮助你确定应选择哪种冗余选项的因素包括:
- 如何在主要区域中复制数据
- 是否要将你的数据复制到地理上距主要区域较远的另一个区域,以防范区域性灾难
- 应用程序是否要求在主要区域出于任何原因而不可用时,能够对次要区域中复制的数据进行读取访问
有关详细信息,请参阅 Azure 存储冗余。
跨位置故障转移
此外,还可以跨站点复制基础结构,以处理区域故障转移。 Azure Site Recovery 可将工作负载从主站点复制到辅助位置。 如果主站点发生中断,可以故障转移到辅助位置。 此故障转移使用户能够继续访问应用程序而不发生中断。 然后,你可在主位置重新运行后故障恢复到主站点。 Azure Site Recovery 是关于虚拟机或物理计算机的复制;它可使工作负荷在发生中断时可用。
虽然 Site Recovery 有众多不错的技术功能,但至少有两个重要的业务优势:
Site Recovery 支持使用 Azure 作为恢复目标,消除了维护辅助物理数据中心的成本和复杂性。
使用 Site Recovery,在不影响生产环境的情况下针对恢复测试故障转移极其简单。 此功能使得可轻松测试计划内或计划外的故障转移。 毕竟,如果从未尝试故障转移,便不会有很好的灾难恢复计划。
使用 Site Recovery 创建的恢复计划可以如方案要求的那样简单或复杂。 它们可以包括自定义 PowerShell 脚本、Azure 自动化 Runbook 或手动干预步骤。 可以使用恢复计划将工作负载复制到 Azure,轻松制造新的迁移机会,在激增期间发生临时突发,或开发和测试新应用程序。
Azure Site Recovery 适用于本地基础结构中的 Azure 资源或 Hyper-V、VMware 和物理服务器。 它是组织业务连续性和灾难恢复 (BCDR) 策略的重要组成部分,可在主位置发生故障时协调工作负载和应用程序的复制、故障转移和恢复。