评估存储帐户故障转移

已完成

故障转移是系统通过使用数据的复制副本对故障的响应方式。

组织的主管想知道,当系统对故障做出响应时,听众的音乐是否会受到任何类型的干扰。 他们要求你调查故障转移过程的工作原理,并报告对公司及其数据的潜在影响。

在本单元中,你将探索故障转移过程的启动方式及其工作原理。 你将了解启动故障转移时对数据的影响,以及如何估计任何潜在的数据丢失。

故障转移过程的工作原理

Azure 存储允许你在主要区域不可用时将存储帐户故障转移到其他区域。 当故障转移被触发并完成时,可从次要区域访问数据。 在主要区域重新启动之前,可使用次要区域。

流程如下:

  1. 故障发生前

    当主要区域启动并运行时,客户端将使用主要区域。 同时,该数据将异步复制到次要区域。

    Illustration that shows that the primary region is available.

  2. 故障发生

    当主要区域发生故障时,客户端和用户无法访问该主要区域中的数据。 向次要区域的异步复制停止。

    Illustration that shows that the primary region is unavailable before failover.

  3. 故障转移启动

    你或 Microsoft 可以启动故障转移。 当 Microsoft 启动故障转移时,称为“Microsoft 管理的故障转移”。 在故障转移过程中,Azure 存储开始将用户和客户端指向次要区域,而不是主要区域。

    Illustration that shows a failover from the primary region to secondary region.

    你可以使用 Azure 门户或 Azure PowerShell 和 Azure CLI 等工具启动故障转移。 在 Azure 门户中,转到你的存储帐户,然后选择“冗余”>“准备进行故障转移”。

    Screenshot of the Prepare for failover button on Storage account > Redundancy in the Azure portal.

  4. 故障转移完成

    故障转移过程完成后,你的存储帐户将更新为使用本地冗余存储 (LRS)。 如果要将数据复制到次要区域,请配置存储帐户以再次使用异地冗余存储选项,如异地冗余存储 (GRS) 或异地区域冗余存储 (GZRS)。

数据丢失

当你对帐户进行故障转移时,可能会丢失一些数据。 发生这种丢失的原因是,你的数据是以异步方式复制的。 当以这种方式复制数据时,从主要区域复制数据并将其写入次要区域之前,始终会有一段延迟。 这可能是因为在主要区域失败之前,你最新的写入数据尚未复制到次要区域。

此外,启动故障转移时,主要区域中的数据将丢失。 启动故障转移之前未写入次要区域的所有数据也将丢失。

使用“上次同步时间”来了解你可能会遇到的数据丢失的程度。 此属性显示主要区域中的数据写入次要区域的最近时间点。 在此时间点之前写入主要服务器的所有数据都保证在次要服务器上可用。 在此上次同步时间之后写入主要区域的数据在次要区域中可能不可用,并且可能会丢失。

你可以使用 Azure 门户、Azure CLI 或 Azure PowerShell 查找“上次同步时间”。 例如,当你在 Azure 门户中选择“准备进行故障转移”时,将显示“上次同步时间”。

Screenshot of the failover confirmation page with the last sync time shown.

跟踪 Azure 存储服务中断

建议使用 Azure 服务运行状况跟踪 Azure 存储和其他 Azure 服务的运行状况。 你可以通过应用程序订阅这些更新,并配置应用程序以处理问题或向你报告问题。

Screenshot of Azure Service Health > Health history that lists issues that impact your subscriptions.