你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
客户管理的计划的故障转移(预览版)的工作原理
客户管理的计划内故障转移在灾难和恢复规划和测试、预期的大规模灾难的主动补救以及非存储相关中断等场景中很有用。
在计划的故障转移过程中,存储帐户的主要区域和次要区域将会交换。 原来的主要区域被降级后成为新的次要区域,而原来的次要区域被提升后成为新的主要区域。 存储帐户必须同时在主要区域和次要区域中可用,然后才能启动计划的故障转移。
本文介绍在过程中的每个阶段,客户管理的计划的故障转移和故障回复会发生的情况。 要了解由于意外存储终结点中断而进行故障转移的工作原理,请参阅客户管理的(计划外)故障转移的工作原理。
重要
客户管理的计划的故障转移目前处于预览状态,限制为以下区域:
- 法国中部
- 法国南部
- 印度中部
- 印度西部
- 东亚
- 东南亚
有关 beta 版本、预览版或尚未正式发布的版本的 Azure 功能所适用的法律条款,请参阅 Microsoft Azure 预览版的补充使用条款。
若要选择加入预览版,请参阅在 Azure 订阅中设置预览功能,并将 AllowSoftFailover
指定为功能名称。 此预览功能的提供程序名称是 Microsoft.Storage。
重要
计划的故障转移后,存储帐户的上次同步时间 (LST) 值可能会过时,或者在 Azure 文件存储数据存在时报告为 NULL。
在存储帐户的次要区域中定期创建系统快照,以在故障转移和故障回复期间保持使用一致的恢复点。 启动客户管理的计划的故障转移会导致原始主要区域成为新的次要区域。 在某些情况下,在计划的故障转移完成后,新的次要区域中没有系统快照可用,导致帐户的总体 LST 值显示为过时或显示为 Null
。
由于创建、修改或删除对象等用户活动可以触发创建快照,因此在计划的故障转移后发生这些活动的任何帐户都不需要额外的注意。 但是,在触发创建系统快照之前,没有快照或用户活动的帐户可能会继续显示 Null
LST 值。
如有必要,请为存储帐户中的每个共享执行下列活动之一来触发创建快照的操作。 完成后,帐户应在 30 分钟内显示有效的 LST 值。
- 装载共享,然后打开任何文件进行读取。
- 将测试文件或示例文件上传到共享。
计划的故障转移和故障回复期间的冗余管理
提示
要详细了解客户管理的故障转移和故障回复过程中的各种冗余状态,请参阅 Azure 存储冗余,以了解每种冗余状态的定义。
在计划内故障转移过程中,主要区域的存储服务终结点将会变为只读,而剩余的更新完成复制到次要区域。 接下来,将切换所有存储服务终结点的域名服务 (DNS) 条目。 存储帐户的辅助终结点将成为新的主终结点,原始主终结点将会成为新的辅助终结点。 尽管切换了主要区域和次要区域,但每个区域中的数据复制将保持不变。
计划的故障回复过程本质上与计划的故障转移过程相同,但有一个例外。 在计划故障回复期间,Azure 会存储存储帐户的原始冗余配置,并在故障回复时将其还原到其原始状态。 例如,如果存储帐户最初配置为 GZRS,则在故障回复后,存储帐户是 GZRS。
注意
与客户管理的(计划外)故障转移不同,在计划内故障转移期间,必须先完成从主要区域到次要区域的复制,然后再将终结点的 DNS 条目更改为新的次要区域。 因此,只要主要区域和次要区域在整个过程中可用,故障转移或故障回复期间就不会丢失数据。
如何启动故障转移
若要了解如何启动故障转移,请参阅启动帐户故障转移。
计划的故障转移和故障回复过程
下图显示了客户管理的计划内存储帐户故障转移和故障回复期间发生的情况。
正常情况下,客户端通过存储服务终结点将数据写入主要区域中的存储帐户 (1)。 然后将数据从主要区域异步复制到次要区域 (2)。 下图显示了配置为 GRS 的存储帐户的正常状态:
计划的故障转移过程 (GRS/RA-GRS)
通过启动向次要区域进行存储帐户故障转移来开始灾难恢复测试。 以下步骤描述了故障转移过程,后续图像则提供了图示:
- 原始主要区域变为只读。
- 完成将主要区域中的所有数据复制到次要区域。
- 次要区域中存储服务终结点的 DNS 条目将会得到提升,并成为存储帐户的新主要终结点。
故障转移通常需要大约一小时才能完成。
故障转移完成后,原始主要区域将成为新的次要区域 (1),而原始次要区域将成为新的主要区域 (2)。 Blob、表、队列和文件的存储服务终结点 URI 将保持不变,但其 DNS 条目会更改为指向新的次要区域 (3)。 用户可以继续将数据写入到新主要区域中的存储帐户,然后将数据异步复制到新的次要区域 (4),如下图所示:
在处于故障转移状态时,请执行灾难恢复测试。
计划的故障回复过程 (GRS/RA-GRS)
测试完成后,执行另一个故障转移以故障回复到原始主要区域。 在如下图所示的故障转移过程中:
- 原始主要区域变为只读。
- 所有数据完成从当前主要区域到当前次要区域的复制。
- 存储服务终结点的 DNS 条目将更改为重新指向执行初始故障转移前的主要区域。
故障回复通常需要大约一小时才能完成。
完成故障回复后,存储帐户将还原到其原始冗余配置。 在像故障转移前一样继续向原始次要区域 (2) 复制时,用户可以继续将数据写入原始主要区域 (1) 中的存储帐户: