Upgrade von GitHub-Modellen auf die Azure KI-Modellinferenz
Wenn Sie eine generative KI-Anwendung entwickeln möchten, können Sie GitHub-Modelle verwenden, um KI-Modelle zu suchen und kostenlos mit ihnen zu experimentieren. Der Playground und die kostenlose API-Nutzung sind für Anforderungen pro Minute, Anforderungen pro Tag, Token pro Anforderung und gleichzeitige Anforderungen ratenbegrenzt. Wenn Sie eine Ratenbegrenzung erreichen, müssen Sie warten, bis die erreichte Ratenbegrenzung zurückgesetzt wird, bevor Sie weitere Anforderungen machen können.
Sobald Ihre Anwendung produktionsbereit ist, können Sie Ihre Erfahrung upgraden, indem Sie eine Azure KI Services-Ressource in einem Azure-Abonnement bereitstellen und mit der Verwendung des Azure KI-Modellinferenzdiensts beginnen. Sie brauchen in Ihrem Code nichts weiter zu ändern.
Im folgenden Artikel werden die ersten Schritte mit GitHub-Modellen und die Bereitstellung einer Azure KI Services-Ressource mit dem Azure KI-Modellinferenzdienst erläutert.
Voraussetzungen
Um die Schritte dieses Tutorials abzuschließen, benötigen Sie Folgendes:
- Ein GitHub-Konto mit Zugriff auf GitHub-Modelle.
- Ein Azure-Abonnement. Falls Sie kein Abonnement haben, werden Sie aufgefordert, ein Azure-Konto zu erstellen oder Ihr Konto auf ein Vorausbezahlungskonto zu aktualisieren, sobald Sie bereit sind, Ihr Modell für die Produktion bereitzustellen.
Upgrade auf Azure KI-Modellinferenz
Die Ratenbeschränkungen für den Playground und die kostenlose API-Nutzung sollen Ihnen helfen, mit Modellen zu experimentieren und Ihre KI-Anwendung zu entwickeln. Sobald Sie bereit sind, Ihre Anwendung in die Produktion zu bringen, verwenden Sie einen Schlüssel und Endpunkt aus einem kostenpflichtigen Azure-Konto. Sie brauchen in Ihrem Code nichts weiter zu ändern.
So rufen Sie den Schlüssel und den Endpunkt ab:
Navigieren Sie zu GitHub-Modelle, und wählen Sie das Modell aus, an dem Sie interessiert sind.
Wählen Sie im Playground für Ihr Modell API-Schlüssel abrufen aus.
Wählen Sie Produktionsschlüssel abrufen aus.
Wenn Sie kein Azure-Konto haben, wählen Sie „Mein Konto erstellen“ aus, und führen Sie die Schritte zum Erstellen eines Kontos aus.
Wenn Sie über ein Azure-Konto verfügen, wählen Sie Wieder anmelden aus.
Wenn Ihr vorhandenes Konto ein kostenloses Konto ist, müssen Sie zuerst ein Upgrade auf einen Vorausbezahlungsplan durchführen. Nachdem Sie ein Upgrade durchgeführt haben, kehren Sie zum Playground zurück, und wählen Sie erneut API-Schlüssel abrufen aus, und melden Sie sich mit Ihrem aktualisierten Konto an.
Sobald Sie sich bei Ihrem Azure-Konto angemeldet haben, werden Sie zu Azure KI Studio > GitHub weitergeleitet. Es kann ein oder zwei Minuten dauern, bis Ihre anfänglichen Modelldetails in KI Studio geladen werden.
Die Seite wird mit den Details Ihres Modells geladen. Wählen Sie die Schaltfläche Bereitstellen aus, um das Modell für Ihr Konto bereitzustellen.
Nach der Bereitstellung werden der API-Schlüssel und der Endpunkt Ihres Modells in der Übersicht angezeigt. Verwenden Sie diese Werte in Ihrem Code, um das Modell in Ihrer Produktionsumgebung zu verwenden.
An diesem Punkt ist das von Ihnen ausgewählte Modell bereit genutzt zu werden.
Upgraden Ihres Codes für die Verwendung des neuen Endpunkts
Sobald Ihre Azure KI Services-Ressource konfiguriert wurde, können Sie diese aus Ihrem Code heraus nutzen. Um die Azure KI Services-Ressource zu nutzen, benötigen Sie die Endpunkt-URL und den Schlüssel, die im Abschnitt Übersicht angezeigt werden:
Sie können alle unterstützten SDKs verwenden, um Vorhersagen aus dem Endpunkt abzurufen. Die folgenden SDKs werden offiziell unterstützt:
- OpenAI SDK
- Azure OpenAI SDK
- Azure KI-Rückschluss-SDK
Weitere Details und Beispiele finden Sie im Abschnitt Unterstützte Sprachen und SDKs. Das folgende Beispiel zeigt, wie Sie das Azure KI-Modellinferenz-SDK mit dem neu bereitgestellten Modell verwenden:
Installieren Sie das Paket azure-ai-inference
mit Ihrem Paket-Manager, z. B. pip:
pip install azure-ai-inference>=1.0.0b5
Warnung
Azure KI Services-Ressource erfordert die Version azure-ai-inference>=1.0.0b5
für Python.
Anschließend können Sie das Paket verwenden, um das Modell zu nutzen. Das folgende Beispiel zeigt, wie Sie einen Client erstellen, um Chatvervollständigungen zu nutzen:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential
model = ChatCompletionsClient(
endpoint="https://<resource>.services.ai.azure.com/models",
credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)
Erkunden Sie unsere Beispiele,und lesen Sie die API-Referenzdokumentation für die ersten Schritte.
Generieren Sie Ihren ersten Chatabschluss:
from azure.ai.inference.models import SystemMessage, UserMessage
response = client.complete(
messages=[
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
],
model="mistral-large"
)
print(response.choices[0].message.content)
Verwenden Sie den Parameter model="<deployment-name>
, um Ihre Anforderung an diese Bereitstellung weiterzuleiten.
Bereitstellungen funktionieren als Alias eines gegebenen Modells unter bestimmten Konfigurationen. Auf der Konzeptseite Routing erfahren Sie, wie Azure KI Services Bereitstellungen weiterleitet.
Wichtig
Im Gegensatz zu GitHub-Modellen, bei denen alle Modelle bereits konfiguriert sind, können Sie mit der Azure KI Services-Ressource steuern, welche Modelle in Ihrem Endpunkt und unter welcher Konfiguration verfügbar sind. Fügen Sie so viele Modelle hinzu, wie Sie verwenden möchten, bevor Sie sie im model
-Parameter angeben. Erfahren Sie, wie Sie Ihrer Ressource weitere Modelle hinzufügen.
Erkunden zusätzlicher Features
Der Azure KI-Modellinferenzdienst unterstützt weitere Features, die in GitHub-Modellen nicht verfügbar sind, einschließlich:
- Erkunden Sie den Modellkatalog, um zusätzliche Modelle anzuzeigen, die in GitHub-Modellen nicht verfügbar sind.
- Konfigurieren Sie die Inhaltsfilterung.
- Konfigurieren Sie die Ratenbegrenzung (für bestimmte Modelle).
- Erkunden Sie weitere Bereitstellungs-SKUs (für bestimmte Modelle).
- Konfigurieren Sie ein privates Netzwerk.
Haben Sie Probleme?
Weitere Hilfe finden Sie im Abschnitt „Häufig gestellte Fragen“.
Nächste Schritte
- Erkunden Sie den Modellkatalog in Azure KI Studio.
- Fügen Sie Ihrem Endpunkt weitere Modelle hinzu.