你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Chaos Studio 中的故障和操作

在 Azure Chaos Studio 中,作为试验的一部分发生的每个活动都称为“操作”。 最常见的操作类型是“故障”。 本文介绍操作和故障及其各自的属性。

试验操作

操作是作为混沌试验的一部分编排的任何活动。 操作将组织成步骤和分支,使操作可以按顺序或并行运行。 每个操作具有以下属性:

  • 名称:发生的特定操作。 名称通常采用操作 URN 的形式,例如 urn
  • 类型:操作的执行方式。 操作可以是连续的,也可以是离散的。 连续操作在一段时间内不间断地运行。 例如,施加 CPU 压力并持续 10 分钟。 离散操作仅发生一次。 例如,重新启动 Azure Cache for Redis 实例。

操作的类型

Chaos Studio 中有两种操作:

  • 故障:这种操作会导致一个或多个资源发生中断。
  • 时间延迟:这种操作会“等待”,而不会影响任何资源。 它对于在故障之间暂停以等待系统受到上一个故障的影响非常有用。

错误

故障是 Chaos Studio 中最常见的操作。 故障会导致系统发生中断,让你能够验证系统是否有效地处理该中断而不会影响可用性。

故障可以:

  • 具有破坏性。 例如,故障可能会终止进程。
  • 施加压力。 例如,故障可能会增加虚拟内存压力。
  • 增加延迟。
  • 导致配置更改。

除了名称和类型外,故障可能还有持续时间(如果故障是连续的)和参数。 参数描述如何应用故障,并且参数特定于故障名称。 例如,“Azure Cosmos DB 故障转移”故障的一个参数是在写入区域发生故障期间将要提升为写入区域的读取区域。 某些参数是必需的,而其他参数是可选的。

故障可以是基于代理的,也可以是“服务直通”的,具体取决于目标类型。 基于代理的故障要求 Chaos Studio 代理安装在虚拟机或虚拟机规模集上。 该代理可用于 Windows 和 Linux,但并非所有故障都可用于这两种操作系统。 有关每种操作系统支持哪些故障的信息,请参阅 Chaos Studio 故障和操作库。 “服务直通”故障不需要任何代理。 它们直接针对 Azure 资源运行。

故障还包括用于描述将针对其运行故障的资源的选择器名称。 若要了解有关选择器的详细信息,请参阅混沌试验。 仅当资源已作为目标加入并且已在资源上启用了相应的故障功能时,故障才能影响资源。

后续步骤

了解操作和故障后,即可: