Bereitstellen eines Modells und Klassifizieren von Text mithilfe der Runtime-API
Artikel
Sobald Sie mit der Leistung Ihres Modells zufrieden sind, kann es bereitgestellt und für die Textklassifizierung verwendet werden. Durch die Bereitstellung eines Modells wird es für die Verwendung über die Vorhersage-API verfügbar gemacht.
Wenn Sie die Leistung des Modells überprüft und entschieden haben, dass es in Ihrer Umgebung verwendet werden kann, müssen Sie es einer Bereitstellung zuweisen, um es abfragen zu können. Durch das Zuweisen des Modells zu einer Bereitstellung wird es für die Verwendung über die Vorhersage-API verfügbar. Es wird empfohlen, eine Bereitstellung namens production zu erstellen, der Sie das bisher beste Modell zuweisen und es in Ihrem System verwenden. Sie können eine weitere Bereitstellung namens staging erstellen, der Sie das Modell zuweisen, an dem Sie gerade arbeiten, um es zu testen. Es können maximal zehn Bereitstellungen in Ihrem Projekt vorhanden sein.
Wählen Sie im Menü auf der linken Seite Bereitstellen eines Modells aus.
Wählen Sie Bereitstellung hinzufügen aus, um einen neuen Bereitstellungsauftrag zu starten.
Wählen Sie Neue Bereitstellung erstellen aus, um eine neue Bereitstellung zu erstellen und ein trainiertes Modell aus der Dropdownliste unten zuzuweisen. Sie können auch eine vorhandene Bereitstellung überschreiben, indem Sie diese Option und das trainierte Modell auswählen, das Sie ihr aus der Dropdownliste zuweisen möchten.
Hinweis
Das Überschreiben einer vorhandenen Bereitstellung erfordert keine Änderungen an Ihrem Aufruf der Vorhersage-API, aber die Ergebnisse, die Sie erhalten, basieren auf dem neu zugewiesenen Modell.
wählen Sie Bereitstellen aus, um die Bereitstellungsauftrag zu starten.
Nachdem die Bereitstellung ausgeführt wurde, wird ein Ablaufdatum neben dem Vorgang angezeigt. Die Bereitstellung läuft ab, wenn Ihr bereitgestelltes Modell für die Prognose nicht verfügbar ist, was in der Regel zwölf Monate nach Ablauf einer Trainingskonfiguration erfolgt.
Übermitteln des Bereitstellungsauftrags
Übermitteln Sie eine PUT-Anforderung mithilfe der folgenden URL, der Header und des JSON-Texts, um einen Bereitstellungsauftrag zu senden. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.
Der Name des Projekts. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
myProject
{DEPLOYMENT-NAME}
Der Name Ihrer Bereitstellung. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
staging
{API-VERSION}
Die Version der von Ihnen aufgerufenen API. Der hier referenzierte Wert gilt für die neueste veröffentlichte Version. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie hier.
2022-05-01
Header
Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.
Schlüssel
Wert
Ocp-Apim-Subscription-Key
Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.
Anforderungstext
Verwenden Sie die folgende JSON-Datei im Textkörper Ihrer Anforderung. Verwenden Sie den Namen des Modells, das Sie der Bereitstellung zuweisen.
{
"trainedModelLabel": "{MODEL-NAME}"
}
Schlüssel
Platzhalter
Wert
Beispiel
trainedModelLabel
{MODEL-NAME}
Der Modellname, der Ihrer Bereitstellung zugewiesen wird. Sie können nur Modelle zuweisen, für die das Training erfolgreich war. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
myModel
Nachdem Sie Ihre API-Anforderung gesendet haben, erhalten Sie eine Antwort vom Typ 202, die angibt, dass der Auftrag ordnungsgemäß übermittelt wurde. Extrahieren Sie in den Antwortheadern den operation-location-Wert. Er weist das folgende Format auf:
{JOB-ID} wird verwendet, um Ihre Anforderung zu identifizieren, da es sich um einen asynchronen Vorgang handelt. Sie können diese URL verwenden, um den Bereitstellungsstatus abzurufen.
Abrufen des Auftragsstatus der Bereitstellung
Verwenden Sie die folgende GET-Anforderung, um den Status des Bereitstellungsauftrags abzurufen. Sie können die URL verwenden, die Sie im vorherigen Schritt erhalten haben, oder die Platzhalterwerte unten durch Ihre eigenen Werte ersetzen.
Der Name des Projekts. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
myProject
{DEPLOYMENT-NAME}
Der Name Ihrer Bereitstellung. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
staging
{JOB-ID}
Die ID zum Ermitteln des Trainingsstatus Ihres Modells. Diese befindet sich im location-Headerwert, den Sie im vorherigen Schritt erhalten haben.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Die Version der von Ihnen aufgerufenen API. Der hier referenzierte Wert gilt für die neueste veröffentlichte Version. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie hier.
2022-05-01
Header
Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.
Schlüssel
Wert
Ocp-Apim-Subscription-Key
Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.
Antworttext
Nachdem Sie die Anforderung gesendet haben, erhalten Sie die folgende Antwort. Setzen Sie den Abruf dieses Endpunkts fort, bis der Parameter status zu „succeeded“ (erfolgreich) wechselt. Sie sollten einen 200-Code erhalten, der den Erfolg der Anforderung angibt.
Sie können Bereitstellungen austauschen, nachdem Sie ein Modell getestet haben, das einer Bereitstellung zugewiesen ist und das sie einer anderen zuweisen möchten. Beim Austauschen von Bereitstellungen wird das Modell, das der ersten Bereitstellung zugewiesen ist, einer zweiten Bereitstellung zugewiesen. Dann wird das Modell, das der zweiten Bereitstellung zugewiesen ist, der ersten Bereitstellung zugewiesen. Auf diese Weise können Sie die Bereitstellungen production und staging austauschen, wenn Sie das Modell, das der Bereitstellung staging zugewiesen ist, der Bereitstellung production zuweisen möchten.
Wählen Sie auf der Seite Bereitstellen eines Modells die beiden Bereitstellungen aus, die Sie austauschen möchten, und wählen Sie im oberen Menü Bereitstellungen austauschen aus.
Wählen Sie im angezeigten Fenster die Namen der Bereitstellungen aus, die Sie austauschen möchten.
Erstellen Sie eine POST-Anforderung mithilfe der folgenden URL, der Header und des JSON-Texts, um einen Auftrag für den Bereitstellungsaustausch zu starten.
Um eine Bereitstellung in Language Studio zu löschen, wechseln Sie zur Seite Modell bereitstellen. Wählen Sie die Bereitstellung aus, die Sie löschen möchten, und wählen Sie dann im oberen Menü Bereitstellung löschen aus.
Erstellen Sie eine DELETE-Anforderung mithilfe der folgenden URL, der Header und des JSON-Texts, um eine Bereitstellung zu löschen.
Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
myProject
{DEPLOYMENT-NAME}
Dies ist der Name Ihrer Bereitstellung. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
prod
{API-VERSION}
Die Version der von Ihnen aufgerufenen API. Der hier referenzierte Wert gilt für die neueste veröffentlichte Version. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie hier.
2022-05-01
Header
Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.
Schlüssel
Wert
Ocp-Apim-Subscription-Key
Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.
Nachdem Sie Ihre API-Anforderung gesendet haben, erhalten Sie eine Antwort vom Typ 202, die auf einen erfolgreichen Vorgang hinweist. Das bedeutet, dass Ihre Bereitstellung gelöscht wurde. Ein erfolgreicher Aufruf enthält einen Operation-Location-Header, mit dem der Auftragsstatus überprüft wird.
So weisen Sie Bereitstellungsressourcen in anderen Regionen in Language Studio zu:
Vergewissern Sie sich, dass Sie sich selbst derjenigen Ressource als Cognitive Services Language Owner zugewiesen haben, die Sie zum Erstellen des Projekts verwendet haben.
Wechseln Sie zur Seite Bereitstellen eines Modells in Language Studio.
Wählen Sie die Registerkarte Regionen aus.
Wählen Sie Bereitstellungsressource hinzufügen aus.
Wählen Sie eine Sprachressource in einer anderen Region.
Jetzt können Sie Ihr Projekt in den Regionen, denen Sie Ressourcen zugewiesen haben, bereitstellen.
Das programmgesteuerte Zuweisen von Bereitstellungsressourcen erfordert die Authentifizierung mit Microsoft Entra. Microsoft Entra ID wird verwendet, um zu bestätigen, dass Sie über Zugriff auf die Ressourcen verfügen, die Sie Ihrem Projekt für die Bereitstellung in mehreren Regionen zuweisen möchten. Wie Sie die Microsoft Entra-Authentifizierung bei REST-API-Aufrufen programmgesteuert nutzen können, erfahren Sie in der Dokumentation zu Azure KI Services.
Zuweisen einer Ressource
Übermitteln Sie eine POST-Anforderung mit den folgenden Angaben für URL, Header und JSON-Text, um Bereitstellungsressourcen zuzuweisen.
Anfrage-URL
Verwenden Sie zum Erstellen Ihrer API-Anforderung die folgende URL. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.
Der vollständige Ressourcen-ID-Pfad, den Sie zuweisen möchten. Zu finden im Azure-Portal auf der Registerkarte Eigenschaften für die Ressource, im Feld Ressourcen-ID.
Die benutzerdefinierte Subdomäne der Ressource, die Sie zuweisen möchten. Zu finden im Azure-Portal auf der Registerkarte Schlüssel und Endpunkt für die Ressource, als Feld Endpunkt in der URL https://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Ein Regionalcode, der die Region der Ressource angibt, die Sie zuweisen möchten. Zu finden im Azure-Portal auf der Registerkarte Schlüssel und Endpunkt für die Ressource, im Feld Standort/Region.
eastus
Status der zugewiesenen Ressource abrufen
Verwenden Sie die folgende GET-Anforderung, um den Status Ihres Auftrags zur Zuweisung von Bereitstellungsressourcen abzurufen. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.
Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
myProject
{JOB-ID}
Die Auftrags-ID, mit der Sie den Status der Zuweisung Ihrer Bereitstellung abrufen können. Diese steht im operation-location-Headerwert, den Sie von der API als Antwort auf Ihre Anforderung zur Zuweisung von Bereitstellungsressourcen erhalten haben.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Die Version der von Ihnen aufgerufenen API.
2022-10-01-preview
Header
Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.
Schlüssel
Wert
Ocp-Apim-Subscription-Key
Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.
Antworttext
Nachdem Sie die Anforderung gesendet haben, erhalten Sie die folgende Antwort. Setzen Sie den Abruf dieses Endpunkts fort, bis der Parameter status auf succeeded wechselt.
Wenn Sie die Zuweisung einer Bereitstellungsressource zu einem Projekt aufheben oder sie aus diesem entfernen, löschen Sie auch alle Bereitstellungen, die in der Region dieser Ressource vorgenommen wurden.
So heben Sie mit Language Studio die Zuweisung von Bereitstellungsressourcen in anderen Regionen auf oder entfernen sie:
Wechseln Sie zur Registerkarte Regionen auf der Seite Modell bereitstellen.
Wählen Sie die Ressource aus, deren Zuweisung Sie aufheben möchten.
Wählen Sie die Schaltfläche Zuweisung entfernen aus.
Geben Sie in dem nun erscheinenden Fenster den Namen der Ressource ein, die Sie entfernen möchten.
Aufheben der Zuweisung einer Ressource
Übermitteln Sie eine POST-Anforderung mit den folgenden Angaben für URL, Header und JSON-Text, um die Zuweisung von Bereitstellungsressourcen aufzuheben oder sie aus Ihrem Projekt zu entfernen.
Anfrage-URL
Verwenden Sie zum Erstellen Ihrer API-Anforderung die folgende URL. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.
Der vollständige Ressourcen-ID-Pfad, den Sie aufheben möchten. Zu finden im Azure-Portal auf der Registerkarte Eigenschaften für die Ressource, im Feld Ressourcen-ID.
Verwenden Sie die folgende GET-Anforderung, um den Status Ihres Auftrags zur Aufhebung von Bereitstellungsressourcen abzurufen. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.
Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.
myProject
{JOB-ID}
Die Auftrags-ID, mit der Sie den Status der Zuweisung Ihrer Bereitstellung abrufen können. Diese steht im operation-location-Headerwert, den Sie von der API als Antwort auf Ihre Anforderung zur Aufhebung von Bereitstellungsressourcen erhalten haben.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Die Version der von Ihnen aufgerufenen API.
2022-10-01-preview
Header
Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.
Schlüssel
Wert
Ocp-Apim-Subscription-Key
Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.
Antworttext
Nachdem Sie die Anforderung gesendet haben, erhalten Sie die folgende Antwort. Setzen Sie den Abruf dieses Endpunkts fort, bis der Parameter status zu „succeeded“ (erfolgreich) wechselt.