Azure AI Foundry ポータルでモデルをベンチマークする方法

[アーティクル]
12/25/2024

重要

この記事で "(プレビュー)" と付記されている項目は、現在、パブリックプレビュー段階です。このプレビューはサービスレベルアグリーメントなしで提供されており、運用環境ではお勧めしません。特定の機能はサポート対象ではなく、機能が制限されることがあります。詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

この記事では、Azure AI Foundry ポータル内のモデルベンチマークツールを使用し、モデルとデータセットの間でベンチマークを比較する方法について説明します。ベンチマークの結果を分析し、自分のデータでベンチマークを実行する方法についても学習します。ベンチマークは、特定のユースケースまたはアプリケーションの要件を満たすモデルに関して、情報を得たうえで意思決定するために役立ちます。

前提条件

有効な支払い方法を持つ Azure サブスクリプション。無料または試用版の Azure サブスクリプションは機能しません。 Azure サブスクリプションを持っていない場合は、始めるために有料の Azure アカウントを作成してください。
Azure AI Foundry プロジェクト。

モデルカタログを使用してモデルベンチマークにアクセスする

Azure AI は、普及しており、最も頻繁に使用されている一部のモデルのモデルベンチマークをサポートしています。ベンチマークの詳細な結果を使用し、Azure AI Foundry モデルカタログからモデルを直接比較して選択するには、次の手順に従います。

Azure AI Foundry にサインインします。
プロジェクトを開いていない場合、プロジェクトを選択します。
左側のナビゲーションウィンドウから [モデルカタログ] を選択します。

関心のあるモデルまでスクロールして選択します。たとえば、gpt-4o を選択します。この操作でモデルの概要ページが開きます。

ヒント

モデルカタログから、コレクション フィルターを使用し、ベンチマーク結果を選択することで、ベンチマークが使用可能なモデルを表示できます。これらのモデルには、ヒストグラムのようなベンチマーク アイコンがあります。
ベンチマーク タブに移動し、モデルのベンチマーク結果を確認します。
モデルカタログのホームページに戻ります。
モデルカタログのホームページで [モデルの比較] を選択し、ベンチマークサポートのあるモデルを探し、そのメトリックを表示し、さまざまなモデル間のトレードオフを分析します。この分析により、要件に最適なモデルが選択の際にわかります。
目的のタスクを選択し、AI 品質に対するコストなど、関心範囲を指定し、さまざまなモデル間のトレードオフを評価します。
リストビューに切り替えると、各モデルの結果がさらに詳しく表示されます。

ベンチマーク結果の分析

特定のモデルの [ベンチマーク] タブを開いているとき、ベンチマーク結果をより良く理解し、解釈できるよう、広範囲の情報を収集できます。

高レベルの集計スコア: AI 品質、コスト、待機時間、スループットに関するこれらのスコアからは、モデルのパフォーマンスの概要が簡単にわかります。
比較グラフ: これらのグラフには、関連するモデルとの比較でモデルの相対位置が表示されます。
メトリック比較表: この表は各メトリックの詳細な結果を示します。

既定では、Azure AI Foundry では、さまざまなメトリックとデータセットの平均インデックスが表示され、モデルパフォーマンスの概要が提供されます。

特定のメトリックとデータセットのベンチマーク結果にアクセスするには:

グラフ上の展開ボタンを選択します。ポップアップ比較グラフには詳細情報が表示され、さらに柔軟な比較が可能になります。
目的のメトリックを選択し、特定のシナリオに基づいてさまざまなデータセットを選択します。結果の計算に使用されるパブリックデータセットのメトリックと説明の詳細な定義については、詳細情報を選択してください。

データを使用してベンチマーク結果を評価する

前のセクションでは、パブリックデータセットを使用して Microsoft によって計算されたベンチマーク結果を示しました。ただし、データと同じメトリックセットを再生成してみることができます。

モデルカードの [ベンチマーク] タブに戻ります。
[独自のデータで試す] を選択し、自分のデータでモデルを評価します。自分のデータで評価すると、特定のシナリオにおけるモデルのパフォーマンスがわかります。

次の方法で共有

Azure AI Foundry ポータルでモデルをベンチマークする方法

前提条件

モデルカタログを使用してモデルベンチマークにアクセスする

ベンチマーク結果の分析

データを使用してベンチマーク結果を評価する

フィードバック

その他のリソース

次の方法で共有

Azure AI Foundry ポータルでモデルをベンチマークする方法

前提条件

モデル カタログを使用してモデル ベンチマークにアクセスする

ベンチマーク結果の分析

データを使用してベンチマーク結果を評価する

関連するコンテンツ

フィードバック

その他のリソース

モデルカタログを使用してモデルベンチマークにアクセスする