Freigeben über


Benchmarking von Modellen im Azure KI Foundry-Portal

Wichtig

Die in diesem Artikel markierten Elemente (Vorschau) sind aktuell als öffentliche Vorschau verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und sollte nicht für Produktionsworkloads verwendet werden. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

In diesem Artikel lernen Sie, Benchmarks über Modelle und Datasets hinweg zu vergleichen, indem Sie das Tool für Modell-Benchmarks im Azure KI Foundry-Portal verwenden. Sie lernen auch, Benchmarkergebnisse zu analysieren und Benchmarks mit Ihren Daten durchzuführen. Benchmarking kann Ihnen dabei helfen, fundierte Entscheidungen darüber zu treffen, welche Modelle die Anforderungen Ihres jeweiligen Anwendungsfalles oder Ihrer Anwendung erfüllen.

Voraussetzungen

  • Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Kostenlose Versionen oder Testversionen von Azure-Abonnements funktionieren nicht. Wenn Sie noch kein Azure-Abonnement haben, erstellen Sie zunächst ein kostenpflichtiges Azure-Konto.

  • Ein Azure KI Foundry-Projekt

Zugreifen auf Modell-Benchmarks über den Modellkatalog

Azure KI unterstützt Modell-Benchmarking für ausgewählte Modelle, die beliebt sind und am häufigsten verwendet werden. Führen Sie die folgenden Schritte aus, um detaillierte Benchmarkergebnisse zum Vergleichen und Auswählen von Modellen direkt im Azure KI Foundry-Modellkatalog zu verwenden:

  1. Melden Sie sich bei Azure KI Foundry an.
  2. Wenn Sie sich noch nicht in Ihrem Projekt befinden, wählen Sie es aus.
  3. Wählen Sie im linken Navigationsbereich Modellkatalog aus.
  1. Wählen Sie das Modell aus, das Sie interessiert. Wählen Sie z. B. gpt-4o aus. Diese Aktion öffnet die Übersichtsseite des Modells.

    Tipp

    Im Modellkatalog können Sie die Modelle anzeigen, für die Benchmarks verfügbar sind, indem Sie den Filter Sammlungen verwenden und Benchmarkergebnisse auswählen. Diese Modelle weisen ein Benchmarks-Symbol auf, das wie ein Histogramm aussieht.

  2. Wechseln Sie zur Registerkarte Benchmarks, um die Benchmarkergebnisse für das Modell zu überprüfen.

    Screenshot der Registerkarte „Benchmarks“ für „gpt-4o“.

  3. Kehren Sie zur Startseite des Modellkatalogs zurück.

  4. Wählen Sie auf der Startseite des Modellkatalogs Modelle vergleichen aus, um Modelle mit Benchmarkunterstützung zu erkunden, ihre Metriken anzuzeigen und die Abwägungen zwischen verschiedenen Modellen zu analysieren. Diese Analyse kann Ihre Auswahl des Modells unterstützen, das Ihren Anforderungen am besten entspricht.

    Screenshot der Schaltfläche „Modellvergleich“ auf der Hauptseite des Modellkatalogs.

  5. Wählen Sie Ihre gewünschten Aufgaben aus, und geben Sie die relevanten Dimensionen an, z. B. KI-Qualität im Vergleich zu Kosten, um die Abwägungen zwischen verschiedenen Modellen zu bewerten.

  6. Sie können zur Listenansicht wechseln, um auf detailliertere Ergebnisse für jedes Modell zuzugreifen.

    Screenshot eines Beispiels für die Vergleichsansicht von Benchmarks.

Analysieren von Benchmarkergebnissen

Wenn Sie sich auf der Registerkarte „Benchmarks“ für ein bestimmtes Modell befinden, können Sie umfangreiche Informationen sammeln, um die Benchmarkergebnisse besser zu verstehen und zu interpretieren. Dazu zählen folgende:

  • Allgemeine aggregierte Bewertungen: Diese Bewertungen für KI-Qualität, Kosten, Latenz und Durchsatz bieten einen schnellen Überblick über die Leistung des Modells.

  • Vergleichsdiagramme: Diese Diagramme zeigen die relative Position des Modells im Vergleich zu verwandten Modellen an.

  • Vergleichstabelle für Metriken: Diese Tabelle enthält detaillierte Ergebnisse für jede Metrik.

    Screenshot der Registerkarte „Benchmarks“ für „gpt-4o“.

Standardmäßig zeigt Azure KI Foundry einen durchschnittlichen Index für verschiedene Metriken und Datasets an, um einen allgemeinen Überblick über die Modellleistung bereitzustellen.

So greifen Sie auf Benchmarkergebnisse für eine bestimmte Metrik und ein bestimmtes Dataset zu

  1. Wählen Sie die Schaltfläche „Erweitern“ im Diagramm aus. Das Popupvergleichsdiagramm zeigt detaillierte Informationen an und bietet mehr Flexibilität für den Vergleich.

    Screenshot der Schaltfläche „Erweitern“, die für ein detailliertes Vergleichsdiagramm ausgewählt werden kann.

  2. Wählen Sie die relevante Metrik und dann verschiedene Datasets basierend auf Ihrem jeweiligen Szenario aus. Wenn Sie detailliertere Definitionen der Metriken und Beschreibungen der öffentlichen Datasets, die zum Berechnen von Ergebnissen verwendet werden, erhalten möchten, wählen Sie Weitere Informationen aus.

    Screenshot des Vergleichsdiagramms mit einer bestimmten Metrik und einem bestimmten Dataset.

Auswerten von Benchmarkergebnissen mit Ihren Daten

In den vorherigen Abschnitten wurden die von Microsoft mithilfe eines öffentlichen Datasets berechneten Benchmarkergebnisse gezeigt. Sie können jedoch versuchen, denselben Satz von Metriken mit Ihren Daten neu zu generieren.

  1. Kehren Sie zur Registerkarte Benchmarks auf der Modellkarte zurück.

  2. Wählen Sie Mit eigenen Daten testen aus, um das Modell mit Ihren Daten auszuwerten. Anhand der Auswertung Ihrer Daten können Sie sehen, wie das Modell in Ihren jeweiligen Szenarien funktioniert.

    Screenshot der auszuwählenden Schaltfläche, um mit eigenen Daten auszuwerten.