你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
使用 Azure 门户设置针对 Azure Cosmos DB for MongoDB vCore 指标的警报
适用对象: MongoDB vCore
本文介绍如何使用 Azure 门户设置和管理针对 Azure Cosmos DB for MongoDB vCore 的操作指标的警报。 可以根据 Azure 服务的监视指标创建警报,以便主动管理群集。
我们将设置一个将在指定指标超出阈值时触发的警报。 首次满足条件时,将会触发警报,之后也将继续触发,直到不再满足条件。
可以将警报配置为在触发时执行以下操作:
- 向服务管理员和共同管理员发送电子邮件通知。
- 将电子邮件发送到额外的指定地址。
- 调用 Webhook。
可以使用以下工具配置和管理警报规则:
通过 Azure 门户针对指标创建警报规则
按照以下步骤基于指标创建警报规则:
- 在 Azure 门户中,选择要监视的 Azure Cosmos DB for MongoDB vCore 群集。
- 在边栏的“监视”部分下选择“警报”,然后依次选择“创建”、“警报规则”。
- 在“条件”选项卡上,选择“选择信号”下拉列表旁边的“查看所有信号”。
- 从可用信号列表中选择指标。 例如,依次选择“存储百分比”、“应用”。
- 在“创建警报规则”页的“条件”选项卡上的“警报逻辑”下,配置以下内容:
- 对于“阈值”,请选择“静态”。
- 对于“聚合类型”,请选择“平均值”。
- 对于“运算符”,请选择“大于”。
- 对于“阈值”,请输入 85。
- 选择“操作”选项卡。
- 确保“使用操作组”处于选中状态,然后选择“创建操作组”,以创建一个将在警报触发时接收通知的新组。
- 在“创建操作组”表单上,确认“订阅”、“资源组”,指定“区域”,然后输入“操作组名称”和该组的“显示名称”。
- 选择页面底部的“下一步: 通知”。
- 在“通知”选项卡的“通知类型”下,选择“电子邮件/短信/推送/语音”。
- 在“电子邮件/短信/推送/语音”表单上,输入要通知的收件人的电子邮件地址和电话号码。 然后选择确定。
- 在“创建操作组”表单上,提供通知的名称。
- 选择“查看 + 创建”,然后选择“创建”以完成操作组设置。
- 新的操作组会显示在“创建警报规则”页的“操作”选项卡上的“操作组名称”下。
- 选择页面底部的“下一步: 详细信息”。
- 在“详细信息”选项卡上,为警报规则设置“严重性”级别。 为规则提供易于识别的“名称”和一个可选的“说明”。
- 选择“查看 + 创建”,然后选择“创建”以完成警报规则。 警报将在几分钟内处于活动状态,并将按配置触发。
管理警报
创建警报后,可以通过多种方式查看、修改或管理警报:
- 禁用或启用警报可暂时停止或恢复接收通知。
- 编辑或删除警报规则。
若要访问警报,请在群集属性中边栏的“监视”部分下,选择“警报”,然后在工具栏中选择“警报规则”。
建议的警报
建议使用以下警报来帮助监视和维护 Azure Cosmos DB for MongoDB vCore 群集。
磁盘空间
监视磁盘空间对于每个生产群集都至关重要。 基础数据库需要足够的可用磁盘空间才能正常运行。 如果磁盘已满,群集的物理分片(节点)可能会脱机并拒绝启动,直到有更多可用空间。 在这种情况下,必须向 Microsoft 提交支持请求来解决问题。
建议对每个群集中的所有节点(包括非生产环境)都设置磁盘空间警报。 磁盘空间使用情况警报提供早期警告,可帮助你采取主动措施来维护节点运行状况。
为获得最佳结果,可设置一系列在使用率达到阈值 75%、85% 和 95% 时发出的警报。 所选的特定百分比可能取决于数据引入速度,因为快速引入可以快速填充磁盘。
若要释放磁盘空间,请考虑以下操作:
- 检查你的数据保留策略,并在可能的情况下将较旧的数据移至冷存储。
- 根据需要增加节点容量。 每个节点最多可支持 32 TiB 的存储。
CPU 使用率
监视 CPU 使用率有助于建立性能基线。 例如,如果群集的 CPU 使用率通常徘徊在 40-60% 左右,突然增加到 95% 可能表示存在异常。
CPU 使用率峰值可能是由于有机增长或低效查询造成的。 创建 CPU 使用率警报时,请设置较长的聚合周期以捕获持续的增长并忽略瞬时峰值。 较长的聚合周期有助于做出有关纵向扩展或缩减群集计算的决策。 对于业务模式包括 CPU 使用率定期出现峰值以及其间存在长期低谷期的工作负载,请考虑使用自动缩放计算。
设置好这些警报,便可以主动监视和管理 Azure Cosmos DB for MongoDB vCore 群集,从而保持高可用性和性能。