Machine Learning マネージド エンドポイントの自動スケーリングについて

nakagawa 20 評価のポイント
2025-02-20T05:19:15.9833333+00:00

※本質問を投稿する際の「child tag」に「Azure SQL データベース」しか表示されなかったため、質問内容と異なりますが、「Azure SQL データベース」タグを選択しています。

【質問】

Azure Machine Learning マネージド エンドポイントの自動スケーリングについて、以下に質問させていただきます。

ご回答よろしくお願いします。

①自動スケーリングでマネージド エンドポイントが複数存在する場合、端末から受信したリクエストの負荷分散方式は何になりますか?(ラウンドロビン?)

②マネージド エンドポイントが使用するVMに対する「コア数」のクォータ上限値は、自動スケーリングの最大VM数分だけ設定しておく必要がありますか?

以上です。

監視対象外
監視対象外
タグは Microsoft によって監視されません。
214 件の質問
0 件のコメント コメントはありません
{count} 件の投票

承認済みの回答
  1. JAYA SHANKAR G S 485 評価のポイント Microsoft ベンダー
    2025-02-20T09:52:29.0366667+00:00

    こんにちは nakagawa,

    1. オートスケーリングを伴う複数の管理エンドポイントの負荷分散方法

    Azure MLモデルエンドポイントでは、負荷分散は単一のエンドポイント内のデプロイメントレベルで管理されます。エンドポイント内では、複数のデプロイメント(モデルのバージョン)を作成し、トラフィックルールを使用してそれらの間でトラフィックを分配できます。トラフィックは特定の割合に基づいて割り当てることができます。

    詳細については、こちらを参照してください。

    1. オートスケーリングにおけるVMの最大コア数のクォータ設定

    インスタンスを選択する必要があり、コアを選択する必要はありません。通常、インスタンスを選択すると、コアの数とコストが表示されます。

    enter image description here

    追加する必要があるのはインスタンスの数だけで、十分なクォータがあることを確認してください。

    ここに記載されています

    アップグレードを行うために、20%の追加計算リソースを確保します。たとえば、デプロイメントで10インスタンスを要求する場合、12のクォータを持っている必要があります。

    ここでは12のインスタンスが必要で、選択したインスタンスが4コアの場合、48コアのクォータが必要です。

    私は英語からの回答を翻訳していますので、文法的な問題があればお許しください。

    1 人がこの回答が役に立ったと思いました。

0 件の追加の回答

並べ替え方法: 最も役に立つ

お客様の回答

回答は、質問作成者が [承諾された回答] としてマークできます。これは、ユーザーが回答が作成者の問題を解決したことを知るのに役立ちます。