Azure Portal を使用して Azure Cosmos DB for PostgreSQL のメトリックアラートを設定する

[アーティクル]
08/15/2024

適用対象: Azure Cosmos DB for PostgreSQL (PostgreSQL の Citus データベース拡張機能を利用)

この記事では、Azure Portal を使用して Azure Cosmos DB for PostgreSQL のアラートを設定する方法について説明します。お使いの Azure のサービスの監視メトリックに基づいて、アラートを受け取ることができます。

指定したメトリックの値がしきい値を超えた場合に、アラートがトリガーされるように設定します。条件が最初に一致したときにアラートがトリガーされ、その後も引き続きトリガーが行われます。

アラートがトリガーされたときに実行されるように構成できるアクションは次のとおりです。

サービスの管理者および共同管理者に電子メール通知を送信する。
指定した追加の電子メールアドレスに電子メールを送信する。
Webhook を呼び出す。

アラートルールを構成したり、その情報を取得したりするには、以下を使用します。

Azure Portal でメトリックのアラートルールを作成する

Azure Portal で、監視する Azure Cosmos DB for PostgreSQL サーバーを選択します。
サイドバーの [監視] セクションで、[アラート] を選択し、[作成] または [アラートルールの作成] を選択します。
[シグナルの選択] 画面が開きます。アラート通知のシグナルの一覧からメトリックを選択します。この例では、[ストレージの割合] を選択します。
[アラートルールの作成] ページの [条件] タブの [アラートロジック] で、次の項目を完了します。
- [しきい値] で、[静的] を選択します。
- [集計の種類] は、[平均] を選択します。
- [演算子] として、[次の値より大きい] を選択します。
- [しきい値] には「85」を入力します。
[アクション] タブを選択し、[アクショングループの作成] を選択して、アラートに関する通知を受信する新しいグループを作成します。
[アクショングループの作成] フォームで、[サブスクリプション]、[リソースグループ]、および [リージョン] を選択し、グループの名前と表示名を入力します。
ページの下部にある [次へ: 通知] を選択します。
[通知] タブの [通知の種類] で、[メール/SMS メッセージ/プッシュ/音声] を選択します。
[メール/SMS メッセージ/プッシュ/音声] フォームで、通知の種類と任意の受信者のメールアドレスと電話番号を入力し、[OK] を選択します。
[アクショングループの作成] フォームで、新しい通知の名前を入力します。
[確認と作成] を選択し、次に [作成] を選択してアクショングループを作成します。新しいアクショングループが作成され、[アラートルールの作成] ページの [アクション] タブの [アクショングループ名] に表示されます。
ページの下部にある [次へ: 詳細] を選択します。
[詳細] タブで、ルールの重大度を選択します。ルールに簡単に識別できる名前を付け、必要に応じて説明を追加します。
[確認と作成] を選択し、次に [作成] を選択してアラートを作成します。数分後にアラートがアクティブになり、前述のようにトリガーされます。

Manage alerts

アラートを作成したら、それを選択して次のアクションを実行できます。

このアラートに関連するメトリックのしきい値と、前日の実際の値を示すグラフを表示する。
アラートルールを編集または削除する。
アラートを無効にしてアラートを一時的に停止する、または有効にして通知の受け取りを再開する。

推奨されるアラート

設定する推奨アラートの例をいくつか次に示します。

ディスク領域

監視とアラートは、すべての運用環境のクラスターにとって重要です。正常に動作するには、基になる PostgreSQL データベースに空きディスク領域が必要です。ディスクがいっぱいになると、データベースサーバーノードはオフラインになり、領域が使用可能になるまで起動できません。その時点で、この状況を解決するには、Microsoft にサポートを要求する必要があります。

運用環境以外で使用する場合であっても、すべてのクラスターのすべてのノードでディスク領域アラートを設定することをお勧めします。ディスク領域使用量アラートでは、介入してノードを正常な状態に保つために必要な事前警告が提供されます。最良の結果を得るには、75%、85%、95% の使用率で一連のアラートを試してみてください。データインジェストが速いほどディスクがいっぱいになるのも速いため、選択するパーセンテージは、データインジェストの速度に依存します。

ディスクが容量制限に近づいたら、次の方法で空き領域を増やしてみます。

データ保持ポリシーを検討します。可能であれば、古いデータをコールドストレージに移動します。
クラスターにノードを追加し、シャードを再調整することを検討します。再調整を行うと、より多くのコンピューターにデータが分散されます。
ワーカーノードの容量を増やすことを検討します。各ワーカーに許されるストレージの最大量は 2 TiB です。ただし、ノードを追加する方が短時間で完了するため、ノードのサイズを変更する前に、ノードを追加する必要があります。

CPU 使用率

CPU 使用率の監視は、パフォーマンスのベースラインを確立するのに役立ちます。たとえば、CPU 使用率が通常は約 40 - 60% であるとします。 CPU 使用率が急に 95% 程度まで上昇し始めたら、異常があることがわかります。 CPU 使用率は、有機的成長を反映する場合もありますが、不適切なクエリを示していることもあります。 CPU アラートを作成するときは、長期間の増加が検出されて、瞬間的な急増が無視されるように、集計単位を長く設定します。

次のステップ

アラートでの webhook の構成に関する詳細情報を確認します。
メトリック収集の概要情報を入手して、サービスの可用性と応答性を確認します。

次の方法で共有

Azure Portal を使用して Azure Cosmos DB for PostgreSQL のメトリックアラートを設定する

Azure Portal でメトリックのアラートルールを作成する

Manage alerts

推奨されるアラート

ディスク領域

CPU 使用率

次のステップ

フィードバック

その他のリソース

次の方法で共有

Azure Portal を使用して Azure Cosmos DB for PostgreSQL のメトリック アラートを設定する

Azure Portal でメトリックのアラート ルールを作成する

Manage alerts

推奨されるアラート

ディスク領域

CPU 使用率

次のステップ

フィードバック

その他のリソース

Azure Portal を使用して Azure Cosmos DB for PostgreSQL のメトリックアラートを設定する

Azure Portal でメトリックのアラートルールを作成する