你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用 Azure 门户设置针对 Azure Cosmos DB for MongoDB vCore 指标的警报

适用对象: MongoDB vCore

本文介绍如何使用 Azure 门户设置和管理针对 Azure Cosmos DB for MongoDB vCore 的操作指标的警报。 可以根据 Azure 服务的监视指标创建警报,以便主动管理群集。

我们将设置一个将在指定指标超出阈值时触发的警报。 首次满足条件时,将会触发警报,之后也将继续触发,直到不再满足条件。

可以将警报配置为在触发时执行以下操作:

  • 向服务管理员和共同管理员发送电子邮件通知。
  • 将电子邮件发送到额外的指定地址。
  • 调用 Webhook。

可以使用以下工具配置和管理警报规则:

通过 Azure 门户针对指标创建警报规则

按照以下步骤基于指标创建警报规则:

  1. Azure 门户中,选择要监视的 Azure Cosmos DB for MongoDB vCore 群集。
  2. 在边栏的“监视”部分下选择“警报”,然后依次选择“创建”、“警报规则”。 Azure 门户中 Azure Cosmos DB for MongoDB vCore 中的警报规则创建页的屏幕截图。
  3. 在“条件”选项卡上,选择“选择信号”下拉列表旁边的“查看所有信号”。
  4. 从可用信号列表中选择指标。 例如,依次选择“存储百分比”、“应用”Azure 门户中的警报条件选择面板的屏幕截图,其中选择了指标。
  5. 在“创建警报规则”页的“条件”选项卡上的“警报逻辑”下,配置以下内容:
    • 对于“阈值”,请选择“静态”。
    • 对于“聚合类型”,请选择“平均值”。
    • 对于“运算符”,请选择“大于”。
    • 对于“阈值”,请输入 85。
  6. 选择“操作”选项卡。Azure 门户中所选指标的警报定义的屏幕截图。
  7. 确保“使用操作组”处于选中状态,然后选择“创建操作组”,以创建一个将在警报触发时接收通知的新组。 Azure 门户中的操作组创建面板的屏幕截图。
  8. 在“创建操作组”表单上,确认“订阅”、“资源组”,指定“区域”,然后输入“操作组名称”和该组的“显示名称”。
  9. 选择页面底部的“下一步: 通知”。 Azure 门户中的操作组基本信息的屏幕截图。
  10. 在“通知”选项卡的“通知类型”下,选择“电子邮件/短信/推送/语音”。
  11. 在“电子邮件/短信/推送/语音”表单上,输入要通知的收件人的电子邮件地址和电话号码。 然后选择确定
  12. “创建操作组”表单上,提供通知的名称。 在 Azure 门户中创建电子邮件通知的屏幕截图。
  13. 选择“查看 + 创建”,然后选择“创建”以完成操作组设置。
  14. 新的操作组会显示在“创建警报规则”页的“操作”选项卡上的“操作组名称”下。
  15. 选择页面底部的“下一步: 详细信息”。 Azure 门户中已完成的警报规则操作选项卡的屏幕截图。
  16. 在“详细信息”选项卡上,为警报规则设置“严重性”级别。 为规则提供易于识别的“名称”和一个可选的“说明”。 Azure 门户中已完成的警报规则详细信息选项卡的屏幕截图。
  17. 选择“查看 + 创建”,然后选择“创建”以完成警报规则。 警报将在几分钟内处于活动状态,并将按配置触发。

管理警报

创建警报后,可以通过多种方式查看、修改或管理警报:

  • 禁用或启用警报可暂时停止或恢复接收通知
  • 编辑或删除警报规则

若要访问警报,请在群集属性中边栏的“监视”部分下,选择“警报”,然后在工具栏中选择“警报规则”Azure 门户中 Azure Cosmos DB for MongoDB vCore 中的警报页的屏幕截图。

建议的警报

建议使用以下警报来帮助监视和维护 Azure Cosmos DB for MongoDB vCore 群集。

磁盘空间

监视磁盘空间对于每个生产群集都至关重要。 基础数据库需要足够的可用磁盘空间才能正常运行。 如果磁盘已满,群集的物理分片(节点)可能会脱机并拒绝启动,直到有更多可用空间。 在这种情况下,必须向 Microsoft 提交支持请求来解决问题。

建议对每个群集中的所有节点(包括非生产环境)都设置磁盘空间警报。 磁盘空间使用情况警报提供早期警告,可帮助你采取主动措施来维护节点运行状况。

为获得最佳结果,可设置一系列在使用率达到阈值 75%、85% 和 95% 时发出的警报。 所选的特定百分比可能取决于数据引入速度,因为快速引入可以快速填充磁盘。

若要释放磁盘空间,请考虑以下操作:

  • 检查你的数据保留策略,并在可能的情况下将较旧的数据移至冷存储。
  • 根据需要增加节点容量。 每个节点最多可支持 32 TiB 的存储

CPU 使用率

监视 CPU 使用率有助于建立性能基线。 例如,如果群集的 CPU 使用率通常徘徊在 40-60% 左右,突然增加到 95% 可能表示存在异常。

CPU 使用率峰值可能是由于有机增长或低效查询造成的。 创建 CPU 使用率警报时,请设置较长的聚合周期以捕获持续的增长并忽略瞬时峰值。 较长的聚合周期有助于做出有关纵向扩展或缩减群集计算的决策。 对于业务模式包括 CPU 使用率定期出现峰值以及其间存在长期低谷期的工作负载,请考虑使用自动缩放计算

设置好这些警报,便可以主动监视和管理 Azure Cosmos DB for MongoDB vCore 群集,从而保持高可用性和性能。