Übersicht: Bereitstellen von KI-Modellen in Azure KI Studio
Der Modellkatalog in Azure KI Studio ist der Hub, um eine Vielzahl von Modellen zu entdecken und zu verwenden, mit denen Sie generative KI-Anwendungen erstellen können. Modelle müssen bereitgestellt werden, um sie für den Empfang von Rückschlussanforderungen zur Verfügung zu stellen. Der Prozess der Interaktion mit einem bereitgestellten Modell wird als Rückschließen bezeichnet. Azure KI Studio bietet je nach Ihren Bedürfnissen und Modellanforderungen eine umfassende Suite von Bereitstellungsoptionen für diese Modelle.
Bereitstellen von Modellen
Die Bereitstellungsoptionen variieren je nach Modelltyp:
- Azure OpenAI-Modelle: Die aktuellsten OpenAI-Modelle mit Unternehmensfeatures aus Azure.
- „Modelle als Dienstleistung“-Modelle: Für diese Modelle ist kein Computekontingent aus Ihrem Abonnement erforderlich. Mit dieser Option können Sie Ihr Modell als Dienstleistung (Model as a Service, MaaS) bereitstellen. Sie verwenden eine Bereitstellung als serverlose API, und jedes Token wird nutzungsbasiert in Rechnung gestellt.
- Offene und benutzerdefinierte Modelle: Der Modellkatalog bietet Zugriff auf eine große Vielzahl von Modellen über Modalitäten hinweg, die offenen Zugriff haben. Sie können offene Modelle in Ihrem eigenen Abonnement mit einer verwalteten Infrastruktur, VMs und einer bestimmten Anzahl von Instanzen für die Kapazitätsverwaltung hosten. Es gibt eine breite Palette von Modellen von Azure OpenAI, HuggingFace und NVIDIA.
Azure KI Studio bietet vier verschiedene Bereitstellungsoptionen:
Name | Azure OpenAI-Dienst | Azure KI-Modellinferenz-API | Serverlose API | Verwaltete Computeressourcen |
---|---|---|---|---|
Welche Modelle können bereitgestellt werden? | Azure OpenAI-Modelle | Azure OpenAI-Modelle und Modelle als Dienstleistung | Modelle als Dienstleistung | Offene und benutzerdefinierte Modelle |
Bereitstellungsressource | Azure OpenAI-Ressource | Azure KI Services-Ressource | KI-Projektressource | KI-Projektressource |
Am besten geeignet, wenn | Sie planen, nur OpenAI-Modelle zu verwenden | Sie planen, die führenden Modelle im Azure KI-Katalog zu nutzen, einschließlich OpenAI. | Sie planen, ein einzelnes Modell von einem bestimmten Anbieter (mit Ausnahme von OpenAI) zu verwenden. | Wenn Sie beabsichtigen, offene Modelle zu verwenden und genügend Computekontingent in Ihrem Abonnement zur Verfügung zu haben. |
Abrechnungsbasen | Tokenverwendung und PTU | Verwendung von Token | Tokenverbrauch1 | Computekernstunden2 |
Anweisungen zur Bereitstellung | Bereitstellen in Azure OpenAI Service | Bereitstellen für Azure KI-Modellinferenz | Bereitstellen für Serverlose API | Bereitstellen für verwaltete Compute |
1 Eine minimale Endpunktinfrastruktur wird pro Minute abgerechnet. Beim nutzungsbasierten Modell wird Ihnen die Infrastruktur, die das Modell hostet, nicht in Rechnung gestellt. Nachdem Sie den Endpunkt gelöscht haben, fallen keine weiteren Gebühren an.
2 Die Abrechnung erfolgt auf Minutenbasis in Abhängigkeit von der Produktebene und der Anzahl der Instanzen, die seit der Erstellung in der Bereitstellung verwendet wurden. Nachdem Sie den Endpunkt gelöscht haben, fallen keine weiteren Gebühren an.
Tipp
Weitere Informationen zum Nachverfolgen von Kosten finden Sie unter Überwachen der Kosten für Modelle, die über den Azure Marketplace angeboten werden.
Wie sollte ich mich Bereitstellungsoptionen nähern?
Azure KI Studio ermutigt Kunden, die Bereitstellungsoptionen zu erkunden und die Lösung zu wählen, die ihre geschäftlichen und technischen Anforderungen am besten erfüllt. Im Allgemeinen können Sie den folgenden Denkprozess verwenden:
Beginnen Sie mit den Bereitstellungsoptionen, die über die größeren Bereiche verfügen. Auf diese Weise können Sie in Ihrer Anwendung schneller durchlaufen und einen Prototyp erstellen, ohne ihre Architektur jedes Mal neu erstellen zu müssen, wenn Sie sich dafür entscheiden, etwas zu ändern. Der Azure KI-Modellinferenzdienst ist ein Bereitstellungsziel, das alle führenden Modelle im Azure KI-Katalog unterstützt, einschließlich der neuesten Innovationen von Azure OpenAI.
Wenn Sie ein bestimmtes Modell verwenden möchten:
Wenn Sie an Azure OpenAI-Modellen interessiert sind, verwenden Sie Azure OpenAI Service, was eine Vielzahl von Funktionen für sie bietet und für sie entwickelt wurde.
Wenn Sie an einem bestimmten Modell aus „Modelle als Dienstleistung“ interessiert sind und nicht erwarten, dass Sie einen anderen Modelltyp verwenden, verwenden Sie Serverlose API-Endpunkte. Sie ermöglichen die Bereitstellung eines einzelnen Modells unter einer eindeutigen Gruppe von Endpunkt-URL und Schlüsseln.
Wenn Ihr Modell in „Modelle als Dienstleistung“ nicht verfügbar ist und Sie in Ihrem Abonnement ein Computekontingent zur Verfügung haben, verwenden Sie Verwaltete Compute, welche die Bereitstellung offener und benutzerdefinierter Modelle unterstützt. Sie ermöglicht außerdem eine hohe Anpassung des Bereitstellungsrückschlussservers, der Protokolle und der detaillierten Konfiguration.
Tipp
Jede Bereitstellungsoption kann verschiedene Funktionen in Bezug auf Netzwerk, Sicherheit und zusätzliche Features wie Inhaltssicherheit bieten. Lesen Sie die Dokumentation für jede von ihnen, um ihre Einschränkungen zu verstehen.