August 2024-Update für Azure OpenAI Provisioned
Mitte August 2024 hat Microsoft Verbesserungen für sein Angebot für den bereitgestellten Durchsatz vorgestellt, mit dem Kundenfeedback zur Benutzerfreundlichkeit und betrieblichen Flexibilität angesprochen wird und neue Zahlungsoptionen und Bereitstellungsszenarien eröffnen.
Dieser Artikel richtet sich an vorhandene Benutzer des Angebots für bereitgestellten Durchsatz. Neue Kunden sollten den Onboardingleitfaden für Azure OpenAI Provisioned zu Rate ziehen.
Was hat sich geändert?
Die folgenden Funktionalitäten werden für das Angebot „Bereitgestellt Verwaltet“ eingeführt.
Wichtig
Die Änderungen in diesem Artikel gelten nicht für das ältere Angebot „Provisioned Classic (PTU-C)“. Sie wirken sich nur auf das Angebot „Bereitgestellt“ (auch als „Bereitgestellt Verwaltet“ bezeichnet) aus.
Verbesserungen der Benutzerfreundlichkeit
Funktion | Vorteil |
---|---|
Modellunabhängiges Kontingent | Ein einziger Kontingentgrenzwert, der alle Modelle/Versionen abdeckt, reduziert die Kontingentverwaltung und beschleunigt das Experimentieren mit neuen Modellen. |
Self-Service-Kontingentanforderungen | Fordern Sie Kontingenterhöhungen ohne Einbeziehung des Vertriebsteams an – viele können automatisch genehmigt werden. |
Standardkontingent für „Bereitgestellt-Verwaltet“ in vielen Regionen | Beginnen Sie schnell, ohne zuerst ein Kontingent anfordern zu müssen. |
Transparente Informationen zur Verfügbarkeit der Echtzeitkapazität + Neuer Bereitstellungsfluss | Weniger Verhandlungen über die Verfügbarkeit beschleunigen die Markteinführung. |
Neues Geschäftsmodell auf Stundenbasis/Reservierung
Funktion | Vorteil |
---|---|
Stündlicher Verbrauch ohne Zusage | Die Zahlungsoption auf Stundenbasis ohne erforderliche Verpflichtung ermöglicht kurzfristige Bereitstellungsszenarien. |
Laufzeitrabatte über Azure-Reservierungen | Azure-Reservierungen bieten erhebliche Rabatte gegenüber dem Stundensatz für Laufzeiten von einem Monat und einem Jahr und bieten flexible Bereiche, welche die Verwaltung und die mit den heutigen ressourcengebundenen Verpflichtungen verbundenen Kosten minimieren. |
Standardkontingent für „Bereitgestellt-Verwaltet“ in vielen Regionen | Beginnen Sie schnell in neuen Regionen, ohne zuerst ein Kontingent anfordern zu müssen. |
Flexible Auswahl des Zahlungsmodells für bestehende bereitgestellte Kunden | Kunden mit Verpflichtungen können mindestens bis Ende 2024 das Prepaidtarif-Modell beibehalten und vorhandene Verpflichtungen über einen Self-Service- oder verwalteten Prozess auf Stundenbasis/Reservierungen migrieren. |
Unterstützt die neuesten Modellgenerationen | Das Stundenbasis-/Reservierungsmodell ist erforderlich, um Modelle bereitzustellen, die nach dem 1. August 2024 veröffentlicht wurden. |
Details zur Verbesserung der Benutzerfreundlichkeit
Die bereitgestellte Kontingentgranularität ändert sich von modellspezifisch zu modellunabhängig. Anstatt dass jedes Modell und jede Version innerhalb des Abonnements und der Region einen eigenen Kontingentgrenzwert hat, gibt es ein einzelnes Kontingentelement pro Abonnement und Region, das die Gesamtzahl der PTUs begrenzt, die für alle unterstützten Modelle und Versionen bereitgestellt werden können.
Modellunabhängiges Kontingent
Ab dem 12. August 2024 wird das modellspezifische Kontingent der bestehenden Kunden in ein modellunabhängiges Kontingent konvertiert. Dies erfolgt automatisch. Beim Übergang geht kein Kontingent verloren. Vorhandene Kontingentgrenzwerte werden summiert und einem neuen modellunabhängigen Kontingentelement zugewiesen.
Das neue modellunabhängige Kontingent wird als Kontingentelement mit dem Namen Bereitgestellte verwaltete Durchsatzeinheit angezeigt, wobei Modell und Version nicht mehr im Namen enthalten sind. Im Bereich „Studio-Kontingent“ werden beim Erweitern des Kontingentelements weiterhin alle Bereitstellungen angezeigt, die zum Kontingentelement beitragen.
Standardkontingent
Neuen und vorhandenen Abonnements wird in vielen Regionen eine kleine Menge an bereitgestelltem Kontingent zugewiesen. Auf diese Weise können Kunden mit der Nutzung dieser Regionen beginnen, ohne zuerst ein Kontingent anfordern zu müssen.
Für bestehende Kunden gilt: Wenn die Region bereits eine Kontingentzuweisung enthält, wird der Kontingentgrenzwert für die Region nicht geändert. Beispielsweise wird er nicht automatisch um den neuen Standardwert erhöht.
Self-Service-Kontingentanforderungen
Kunden erhalten über ihre Vertriebsteams kein Kontingent mehr. Stattdessen verwenden sie das Self-Service-Kontingentanforderungsformular und geben den Kontingenttyp „PTU-Verwaltetet“ an. Auf das Formular kann über einen Link rechts neben dem Kontingentelement zugegriffen werden. Ziel ist es, innerhalb von zwei Werktagen auf alle Kontingentanforderungen zu reagieren.
Der folgende Screenshot zeigt ein modellunabhängiges Kontingent, das von Bereitstellungen unterschiedlicher Typen verwendet wird, sowie den Link zum Anfordern zusätzlicher Kontingente.
Kontingent als ein Grenzwert
Vor dem August-Update war Azure OpenAI Provisioned nur für wenige Kunden verfügbar, und das Kontingent wurde so zugewiesen, um die Möglichkeiten für die Bereitstellung und Nutzung für diese Kunden zu maximieren. Mit diesen Änderungen wird der Vorgang zum Abrufen von Kontingent für alle Benutzer vereinfacht, und es besteht eine größere Wahrscheinlichkeit, beim Versuch von Bereitstellungen an Dienstkapazitätseinschränkungen zu stoßen. Eine neue API und Studio-Erfahrung sind verfügbar, um Benutzern zu helfen, Regionen zu finden, in denen das Abonnement ein Kontingent aufweist und der Dienst über die Kapazität verfügt, Bereitstellungen eines gewünschten Modells zu unterstützen.
Außerdem wird empfohlen, dass Kunden, die Mindestabnahmen verwenden, ihre Bereitstellungen jetzt erstellen, bevor sie Mindestabnahmen erstellen oder erweitern, um sie abzudecken. Dadurch wird sichergestellt, dass die Kapazität vor der Erstellung einer Mindestabnahme verfügbar ist, und ein Überbezug der Mindestabnahme verhindert. Um dies zu unterstützen, wurde die Einschränkung entfernt, die verhinderte, dass Bereitstellungen erstellt werden, die größer waren als ihre Verpflichtungen. Dieser neue Ansatz für Kontingente, Kapazitätsverfügbarkeit und Verpflichtungen entspricht dem, was im Stunden-/Reservierungsmodell bereitgestellt wird, und der Leitfaden zur Bereitstellung vor dem Kauf einer Verpflichtung (oder einer Reservierung für das Stundenmodell) ist für beide identisch.
Weitere Informationen finden Sie unter den folgenden Links: Der Leitfaden für Reservierungen und Verpflichtungen ist der gleiche:
Zahlungsmodell für neue stündliche Reservierung
Hinweis
Die folgende Beschreibung der Zahlungsmodelle gilt nicht für das ältere Angebot „Provisioned Classic (PTU-C)“. Sie wirken sich nur auf das Angebot „Bereitgestellt“ (auch „Bereitgestellt Verwaltet) aus. Provisioned Classic wird weiterhin vom unveränderten Zahlungsmodell der monatlichen Mindestabnahme geregelt.
Microsoft hat ein neues Zahlungsmodell „Stündlich/Reservierung“ für bereitgestellte Bereitstellungen eingeführt. Dies ist zusätzlich zum aktuellen Zahlungsmodell Verpflichtung, das mindestens bis Ende 2024 weiterhin unterstützt wird.
Zahlungsmodell „Verpflichtung“
Eine regionale, monatliche Mindestabnahme ist erforderlich, um Provisioned zu verwenden (längere Laufzeiten sind vertraglich verfügbar).
Mindestabnahmen sind an Azure OpenAI-Ressourcen gebunden, was das Verschieben von Bereitstellungen zwischen Ressourcen erschwert.
Verpflichtungen können während ihrer Laufzeit nicht storniert oder geändert werden, nur das Hinzufügen neuer PTUs ist möglich.
Unterstützt Modelle, die vor dem 1. August 2024 veröffentlicht wurden.
Zahlungsmodell für stündliche Reservierung
Das Zahlungsmodell ist an Azure-Standards für andere Produkte ausgerichtet.
„Stündlicher Verbrauch“ wird ohne Verpflichtung unterstützt.
Rabatte für einen Monat und ein Jahr Laufzeit können als regionale Azure-Reservierungen erworben werden.
Reservierungen können flexibel auf mehrere Abonnements beschränkt sein, und der Bereich kann während der Laufzeit geändert werden.
Unterstützt alle Modelle, sowohl alte als auch neue.
Wichtig
Modelle, die nach dem 1. August 2024 veröffentlicht wurden, erfordern die Verwendung des Zahlungsmodells „Stündlich/Reservierung“. Sie können nicht in Azure OpenAI-Ressourcen bereitgestellt werden, die aktive Verpflichtungen haben. Um Modelle bereitzustellen, die nach dem 1. August veröffentlicht wurden, müssen bestehende Kunden entweder:
- Bereitstellungen in Azure OpenAI-Ressourcen ohne Verpflichtungen erstellen.
- Eine vorhandene Ressource aus den Mindestabnahmen migrieren.
Zahlungsmodellframework
Seit der Veröffentlichung des Zahlungsmodells „stündlich/reserviert“ sind Zahlungsoptionen flexibler, und das Modell rund um Zahlungen für vorhandene Bereitstellungen hat sich geändert. Als die einmonatigen Mindestabnahmen die einzige Möglichkeit zum Kauf waren, sah das Modell so aus:
- Ein PTU-Kontingent von Ihrem Microsoft-Kontoteam abrufen.
- Sie „kaufen“ ein Kontingent von einer Mindestabnahme für die Ressource, in der Sie bereitstellen möchten.
- Sie erstellen Bereitstellungen für die Ressource bis zum Grenzwert der Mindestabnahme.
Der Hauptunterschied zwischen diesem Modell und dem neuen Modell besteht darin, dass früher die einzige Zahlungsmethode für bereitgestellte Ressourcen in einem einmonatigen Laufzeitrabatt bestand. Jetzt können Sie Ressourcen bereitstellen und für Bereitstellungen stündlich bezahlen, wenn Sie möchten, und separat entscheiden, ob Sie sie über eine einmonatige Mindestabnahme (wie zuvor) oder eine Azure-Reservierung rabattieren möchten.
Mit diesem Einsicht ergibt sich die folgende neue Möglichkeit, über Zahlungsmodelle nachzudenken:
- Rufen Sie ein PTU-Kontingent mithilfe des Self-Service-Formulars ab.
- Erstellen Sie Bereitstellungen unter Verwendung Ihres Kontingents.
- Optional kaufen oder verlängern Sie eine Mindestabnahme oder eine Reservierung, um einen Laufzeitrabatt auf Ihre Bereitstellungen anzuwenden.
Die Schritte 1 und 2 sind in allen Fällen identisch. Der Unterschied besteht darin, ob eine Mindestabnahme oder eine Azure-Reservierung als Mittel zur Gewährung des Rabatts verwendet wird. Für beide Modelle gilt:
Es ist möglich, mehr PTUs bereitzustellen als rabattiert werden. (Beispielsweise wird eine kurzfristige Bereitstellung zum Ausprobieren eines neuen Modells ermöglicht, indem die Bereitstellung ohne Erwerb eines Rabatts erfolgt)
Bei der Rabattmethode (Mindestabnahme oder Reservierung) wird der ermäßigte Preis auf eine feste Anzahl von PTUs angewendet und durch einen Bereich definiert, welche Bereitstellungen auf den Rabatt angerechnet werden.
Rabattart Verfügbare Bereiche (innerhalb einer Region) Vertragsbindung Azure OpenAI-Ressource Zeile2 Ressourcengruppe, einzelnes Abonnement, Verwaltungsgruppe (Gruppe von Abonnements), freigegeben (alle Abonnements in einem Abrechnungskonto) Der ermäßigte Preis wird auf bereitgestellte PTUs angewendet und zwar bis zu der im Rabatt enthaltenen Anzahl ermäßigter PTUs.
Für die Anzahl der bereitgestellten PTUs, die über die rabattierten PTUs hinausgehen (oder nicht durch einen anderen Rabatt abgedeckt sind), wird der Stundensatz berechnet.
Die bewährte Methode besteht darin, zuerst Bereitstellungen zu erstellen und dann Rabatte anzuwenden. Damit wird dieser Dienst gewährleistet. Es steht Kapazität zur Verfügung, um Ihre Bereitstellungen zu unterstützen, bevor Sie eine Laufzeitverpflichtung für PTUs erstellen, die Sie nicht verwenden können.
Hinweis
Wenn Sie die bewährten Methoden befolgen, können Sie zwischen dem Zeitpunkt der Erstellung der Bereitstellung und der Erhöhung des Rabatts (Mindestabnahme oder Reservierung) stündliche Gebühren in Rechnung gestellt werden.
Aus diesem Grund empfehlen wir Ihnen, ihren Rabatt unmittelbar nach der Bereitstellung zu erhöhen. Für den Kauf von Azure-Reservierungen gelten andere Voraussetzungen als für Mindestabnahmen. Wir empfehlen Ihnen daher, diese vor der Bereitstellung zu überprüfen, wenn Sie die Mindestabnahmen zum Rabattieren Ihrer Bereitstellung verwenden möchten. Weitere Informationen finden Sie unter Berechtigungen zum Anzeigen und Verwalten von Azure-Reservierungen.
Zuordnen von Bereitstellungen zur Rabattmethode
Kunden, die „Azure OpenAI Provisioned“ vor dem August 2024 verwenden, können beide Zahlungsmodelle gleichzeitig innerhalb eines Abonnements verwenden. Das für die jeweilige Bereitstellung verwendete Zahlungsmodell wird anhand der Azure OpenAI-Ressource bestimmt:
Ressource mit einer aktiven Mindestabnahme
- Die Mindestabnahme rabattiert alle Bereitstellungen für die Ressource bis zur Anzahl der PTUs in der Mindestabnahme. Überzählige PTUs werden pro Stunde abgerechnet.
Ressource ohne aktive Mindestabnahme
- Die Bereitstellungen unter der Ressource sind berechtigt, durch eine Azure-Reservierung rabattiert zu werden. Damit diese Bereitstellungen rabattiert werden können, müssen sie im Rahmen einer aktiven Reservierung erfolgen. Alle Bereitstellungen im Rahmen der Reservierung (einschließlich möglicherweise Bereitstellungen in anderen Ressourcen in demselben Abonnement oder anderen Abonnements) werden als Gruppe bis zur Anzahl der PTUs in der Reservierung rabattiert. Überzählige PTUs werden pro Stunde abgerechnet.
Änderungen am vorhandenen Zahlungsmodus
Kunden, die heute Verpflichtungen haben, können diese mindestens bis Ende 2024 weiterhin nutzen. Dazu gehört auch der Erwerb neuer PTUs für neue oder bestehende Verpflichtungen und das Verwalten des Verlängerungsverhaltens für Verpflichtungen. Das August-Update hat jedoch bestimmte Aspekte der Verpflichtungsvorgangs geändert.
Nur Modelle, die vor dem 1. August 2024 als bereitgestellt veröffentlicht wurden, können für eine Ressource mit Verpflichtung bereitgestellt werden.
Wenn die bereitgestellten PTUs unter einer Verpflichtung die zugesicherten PTUs überschreiten, werden die stündlichen Überschreitungsgebühren für die gleiche stündliche Verbrauchseinheit ausgegeben, die auch für das neue Zahlungsmodell „Stündlich/Reservierung“ verwendet wird. Dadurch können die Überschreitungsgebühren über eine Azure-Reservierung rabattiert werden.
Es ist möglich, mehr PTUs bereitzustellen, als auf der Ressource zugesichert sind. Dies unterstützt die Möglichkeit, die Verfügbarkeit von Kapazitäten zu garantieren, bevor die Verpflichtungsgröße erhöht wird, um sie abzudecken.
Migrieren vorhandener Ressourcen aus Verpflichtungen
Bestehende Kunden können ihre vorhandenen Ressourcen vom Zahlungsmodell „Verpflichtung“ zu „Stündlich/Reservierung“ migrieren, um von der Möglichkeit zu profitieren, die neuesten Modelle bereitzustellen, oder die Rabattierung für verschiedene Bereitstellungen unter einer einzigen Reservierung zu konsolidieren.
Für Kunden stehen zwei Ansätze zur Verfügung, um Ressourcen mithilfe des Modells „Verpflichtung“ zum Modell „Stündlich/Reservierung“ zu migrieren.
Self-Service-Migration
Der Self-Service-Migrationsansatz ermöglicht es einem Kunden, Ressourcen organisch aus ihren Verpflichtungen abzubauen, indem er sie auslaufen lässt. Der Prozess zum Migrieren einer Ressource ist wie folgt:
Legen Sie die vorhandene Verpflichtung so fest, dass sie nicht automatisch verlängert wird, und notieren Sie sich das Ablaufdatum.
Vor dem Ablaufdatum sollte ein Kunde eine Azure-Reservierung erwerben, welche die Gesamtzahl der zugesicherten PTUs pro Abonnement abdeckt. Wenn eine bestehende Reservierung das Abonnement bereits in ihrem Umfang hat, kann sie um die neuen PTUs erweitert werden.
Wenn die Verpflichtung abläuft, werden die Bereitstellungen unter der Ressource automatisch in den Modus „Stündlich/Reservierung“ umgestellt, wobei der Verbrauch durch die Reservierung rabattiert wird.
Dieser Self-Service-Migrationsansatz wird zu einer Überschneidung führen, bei der sowohl die Reservierung als auch die Verpflichtung aktiv sind. Dies ist ein Merkmal dieses Migrationsmodus, und die Zeit der Reservierung oder Verpflichtung für diese Überschneidung wird dem Kunden nicht gutgeschrieben.
Ein alternativer Ansatz für die Self-Service-Migration besteht darin, den Reservierungskauf so zu wechseln, dass er nach Ablauf der Verpflichtung durchgeführt wird. Bei diesem Ansatz werden die Bereitstellungen einen stündlichen Verbrauch für den Zeitraum zwischen dem Ablauf der Verpflichtung und dem Kauf der Reservierung generieren. Wie bei dem vorherigen Modell ist dies ein Merkmal dieses Ansatzes, und dieser stündliche Verbrauch wird nicht gutgeschrieben.
Vorteile der Self-Service-Migration:
- Einzelne Ressourcen können zu unterschiedlichen Zeiten migriert werden.
- Kunden verwalten die Migration, ohne von Microsoft abhängig zu sein.
Nachteile der Self-Service-Migration:
- Während der Umstellung der Abrechnung von „Zugesagt“ auf „Stündlich/Reservierung“ gibt es einen kurzen Zeitraum der doppelten Abrechnung oder von stündlichen Gebühren.
Wichtig
Beide Self-Service-Ansätze generieren einige zusätzliche Gebühren, wenn der Zahlungsmodus von „Zugesichert“ auf „Stündlich/Reservierung“ umgestellt wird. Dies sind Merkmale der Migrationsansätze, und Kunden werden diesen Gebühren nicht gutgeschrieben. Um diese Gebühren zu vermeiden, können die Kunden den unten beschriebenen Ansatz der verwalteten Migration wählen.
Verwaltete Migration
Der Ansatz für die verwaltete Migration erfordert die Zusammenarbeit des Kunden mit Microsoft, um alle PTU-Verpflichtungen in einem Abonnement/einer Region gleichzeitig zu migrieren. Dies läuft folgendermaßen ab:
- Der Kunde wird sein Kontoteam einbinden und eine verwaltete Migration anfordern. Ein Migrationsbesitzer aus dem Microsoft-Team wird zugewiesen werden, um den Kunden bei der Migration zu unterstützen.
- Ein Datum wird ausgewählt werden, an dem alle Ressourcen innerhalb der Abonnements und Regionen der Kunden, die aktuelle PTU-Verpflichtungen enthalten, vom Abrechnungsmodell „Zugesichert“ nach „Stündlich/Reservierung“ migriert werden. Mehrere Abonnements und Regionen können am selben Datum migriert werden.
- Am vereinbarten Datum:
- Der Kunde wird regionale Reservierungen kaufen, um die zugesicherten PTUs abzudecken, die konvertiert werden, und übergibt die Reservierungsinformationen an seinen Microsoft-Migrationskontakt.
- Innerhalb von 2-3 Werktagen werden alle Verpflichtungen proaktiv storniert werden, und die Bereitstellungen, die zuvor als Verpflichtungen vorhanden waren, werden mit der Nutzung des Zahlungsmodells „Stündlich/Reservierung“ beginnen.
- Im Abrechnungszeitraum, der auf denjenigen mit dem Reservierungskauf folgt, wird der Kunde eine Gutschrift für den Reservierungskauf erhalten, der die Teile der stornierten Verpflichtungen abdeckt, beginnend ab dem Zeitpunkt des Kaufs der Reservierung.
Kunden müssen sich an ihre Kontoteams wenden, um eine verwaltete Migration zu planen.
Vorteile der verwalteten Migration:
- Die Massenmigration aller Verpflichtungen in einem Abonnement/einer Region ist für Kunden mit vielen Verpflichtungen von Vorteil.
- Nahtlose Kostenmigration: Keine Möglichkeit der doppelten Abrechnung oder zusätzlicher stündlichen Belastungen.
Nachteile der verwalteten Migration:
- Alle Verpflichtungen in einem Abonnement/einer Region müssen gleichzeitig migriert werden.
- Eine Zeit für die Migration muss mit dem Microsoft-Team koordiniert werden.
Erstellen einer Mindestabnahme für den bereitgestellten Durchsatz
Mindestabnahmen für bereitgestellten Durchsatz werden über die Ansicht Mindestabnahme verwalten in Azure OpenAI Studio erstellt und verwaltet. Sie können zu dieser Ansicht navigieren, indem Sie im Menü „Kontingent“ die Option Mindestabnahme verwalten auswählen:
In der Ansicht Mindestabnahme verwalten können Sie verschiedene Aktionen ausführen:
- Erwerben einer neuen Mindestabnahme oder Bearbeiten einer bestehenden Mindestabnahme
- Überwachen der gesamten Mindestabnahme in Ihrem Abonnement
- Identifizieren und Ergreifen von Maßnahmen für die Mindestabnahme, die zu einer unerwarteten Abrechnung führen kann
In den folgenden Abschnitten werden Sie durch diese Aufgaben geführt.
Erwerben einer Mindestabnahme für den bereitgestellten Durchsatz
Wenn der Mindestabnahmeplan bereit ist, besteht der nächste Schritt darin, die Mindestabnahme zu erstellen. Commitments werden manuell über Azure OpenAI Studio erstellt und erfordern, dass der bzw. die Benutzer*in, der bzw. die das Commitment erstellt, entweder die Rolle Mitwirkende*r oder Cognitive Services-Mitwirkende*r auf Abonnementebene aufweist.
Führen Sie für jedes neue Commitment, das Sie erstellen müssen, die folgenden Schritte aus:
- Öffnen Sie das Dialogfeld zum Erwerb von bereitgestelltem Durchsatz, indem Sie Kontingent>Azure OpenAI bereitgestellt>Mindestabnahme verwalten auswählen.
Wählen Sie Prepaidtarif kaufen aus.
Wählen Sie die Azure OpenAI-Ressource aus, und erwerben Sie das Commitment. Ihre Ressourcen werden in Ressourcen mit bestehender Mindestabnahme, die Sie bearbeiten können, und Ressourcen unterteilt, für die derzeit keine Mindestabnahme vorliegt.
Einstellung | Notizen |
---|---|
Ressource auswählen | Wählen Sie die Ressource aus, in der Sie die bereitgestellte Bereitstellung erstellen. Nachdem Sie das Commitment erworben haben, können Sie die PTUs nicht mehr für eine andere Ressource verwenden, bis das aktuelle Commitment abläuft. |
Typ der Mindestabnahme auswählen | Wählen Sie Bereitgestellt aus. („Bereitgestellt“ ist gleichbedeutend mit „Bereitgestellt-Verwaltet“.) |
Aktuelles bereitgestelltes Kontingent ohne Commit | Die Anzahl der PTUs, die derzeit für Sie zum Committen in dieser Ressource zur Verfügung stehen. |
Zu committender Betrag (PTUs) | Wählen Sie die Anzahl der PTUs aus, für die Sie sich committen. Diese Anzahl kann während der Laufzeit der Mindestabnahme erhöht, aber nicht verringert werden. Geben Sie Werte in Schritten von 50 für den Mindestabnahmetyp „Bereitgestellt“ ein. |
Commitmentstufe für den aktuellen Zeitraum | Der Commitmentzeitraum wird auf einen Monat festgelegt. |
Verlängerungseinstellungen | Automatische Verlängerung mit aktuellen PTUs Automatische Verlängerung mit weniger PTUs Keine automatische Verlängerung |
- Wählen Sie die Option Kaufen. Ein Dialogfeld zur Bestätigung wird angezeigt. Nachdem Sie bestätigt haben, werden Ihre PTUs committet, und Sie können diese verwenden, um eine bereitgestellte Bereitstellung zu erstellen. |
Wichtig
Eine neue Mindestabnahme wird im Voraus für die gesamte Laufzeit in Rechnung gestellt. Wenn die Verlängerungseinstellungen auf automatische Verlängerung festgelegt sind, erhalten Sie basierend auf den Verlängerungseinstellungen erneut an jedem Verlängerungsdatum eine Rechnung.
Bearbeiten einer vorhandenen Mindestabnahme für den bereitgestellten Durchsatz
In der Ansicht „Mindestabnahme verwalten“ können Sie auch eine vorhandene Mindestabnahme bearbeiten. Es gibt zwei Arten von Änderungen, die Sie an einer bestehenden Mindestabnahme vornehmen können:
- Sie können der Mindestabnahme PTUs hinzufügen.
- Sie können die Verlängerungseinstellungen ändern.
Um eine Mindestabnahme zu bearbeiten, wählen Sie die aktuelle Mindestabnahme zur Bearbeitung aus, und wählen Sie dann „Mindestabnahme bearbeiten“ aus.
Hinzufügen von bereitgestellten Durchsatzeinheiten zu vorhandenen Commitments
Durch das Hinzufügen von PTUs zu einer vorhandenen Mindestabnahme können Sie größere oder zahlreichere Bereitstellungen innerhalb der Ressource erstellen. Sie können dies jederzeit während der Laufzeit der Mindestabnahme tun.
Wichtig
Wenn Sie PTUs zu einer Mindestabnahme hinzufügen, werden diese sofort ab dem aktuellen Datum bis zum Ende der Laufzeit der bestehenden Mindestabnahme zu einem anteiligen Betrag in Rechnung gestellt. Durch das Hinzufügen von PTUs wird die Laufzeit der Mindestabnahme nicht zurückgesetzt.
Änder der Verlängerungseinstellungen
Die Einstellungen für die Verlängerung der Mindestabnahme können jederzeit vor dem Ablaufdatum der Mindestabnahme geändert werden. Mögliche Gründe für die Änderung der Verlängerungseinstellungen: Beenden der Nutzung des bereitgestellten Durchsatzes, indem Sie festlegen, dass die Mindestabnahme nicht automatisch verlängert wird, oder Verringern der Nutzung des bereitgestellten Durchsatzes, indem Sie die Anzahl der PTUs reduzieren, die im nächsten Zeitraum committet werden.
Wichtig
Wenn Sie zulassen, dass eine Mindestabnahme abläuft oder ihr Umfang abnimmt, sodass die Bereitstellungen unter der Ressource mehr PTUs erfordern, als in der Mindestabnahme für die Ressource enthalten sind, fallen stündliche Überschreitungsgebühren für alle überschüssigen PTUs an. Eine Ressource mit Bereitstellungen, die insgesamt 500 PTUs umfassen, und einer Mindestabnahme für 300 PTUs generiert stündliche Überschreitungsgebühren für 200 PTUs.
Überwachen der Mindestabnahme und Verhindern unerwarteter Abrechnungen
Der Bereich „Mindestabnahme verwalten“ bietet einen abonnementweiten Überblick über alle Ressourcen mit Mindestabnahme und PTU-Nutzung innerhalb eines bestimmten Azure-Abonnements. Von besonderer Bedeutung sind:
- Committete PTUs, bereitgestellte PTUs und PTU-Nutzung: Diese Zahlen geben die Höhe der Mindestabnahme sowie den Umfang an, der von Bereitstellungen genutzt wird. Maximieren Sie Ihre Investition, indem Sie alle committeten PTUs verwenden.
- Ablaufrichtlinie und -datum: Das Ablaufdatum und die Ablaufrichtlinie geben an, wann eine Mindestabnahme abläuft und was in diesem Fall geschieht. Eine Mindestabnahme, für die die automatische Verlängerung festgelegt ist, generiert am Verlängerungsdatum ein Abrechnungsereignis. Achten Sie bei ablaufenden Mindestabnahmen darauf, dass Sie Bereitstellungen aus diesen Ressourcen vor dem Ablaufdatum löschen, um stündliche Überschreitungsgebühren zu verhindern. Die aktuellen Verlängerungseinstellungen für eine Mindestabnahme.
- Benachrichtigungen: Warnungen zu wichtigen Bedingungen wie nicht genutzte Mindestabnahmen und Konfigurationen, die zu Abrechnungsüberschreitungen führen können. Abrechnungsüberschreitungen können etwa verursacht werden, wenn eine Mindestabnahme abgelaufen ist und noch Bereitstellungen vorhanden sind, aber auf die stündliche Abrechnung umgestellt wurde.
Allgemeine Szenarien für die Verwaltung einer Mindestabnahme
Beenden der Verwendung des bereitgestellten Durchsatzes
Um die Verwendung des bereitgestellten Durchsatzes zu beenden und stündliche Überschreitungsgebühren nach dem Ablauf der Mindestabnahme zu vermeiden, müssen zwei Schritte ausgeführt werden:
- Legen Sie die Verlängerungsrichtlinie für alle Commitments auf Keine automatische Verlängerung fest.
- Löschen Sie die bereitgestellten Bereitstellungen mithilfe des Kontingents.
Verschieben eines Commitments/einer Bereitstellung in eine neue Ressource in demselben Abonnement/derselben Region
Es ist in Azure OpenAI Studio nicht möglich, eine Bereitstellung oder ein Commitment direkt zu einer neuen Ressource zu verschieben. Stattdessen muss eine neue Bereitstellung für die Zielressource erstellt und der Datenverkehr dorthin umgeleitet werden. Um dies zu erreichen, muss ein Commitment für die neue Ressource erworben werden. Da Commitments für einen Zeitraum von 30 Tagen im Voraus berechnet werden, ist es notwendig, diesen Schritt mit dem Ablauf des ursprünglichen Commitments abzustimmen, um die Überschneidung mit dem neuen Commitments und die „Doppelabrechnung“ während der Überlappung zu minimieren.
Es gibt zwei Ansätze, die zur Umsetzung dieses Übergangs ergriffen werden können.
Option 1: Übergang ohne Überschneidung
Diese Option ist mit einer gewissen Ausfallzeit verbunden, erfordert jedoch kein zusätzliches Kontingent und generiert keine zusätzlichen Kosten.
Schritte | Hinweise |
---|---|
Festlegen der Verlängerungsrichtlinie für das ablaufende, bestehende Commitment | Dadurch wird verhindert, dass das Commitment verlängert wird und weitere Gebühren generiert werden |
Löschen Sie vor Ablauf des vorhandenen Commitments seine Bereitstellung | Die Ausfallzeit beginnt zu diesem Zeitpunkt und dauert an, bis die neue Bereitstellung erstellt und Datenverkehr umgeleitet wurde. Sie minimieren die Dauer, indem Sie den Löschvorgang so nah am Ablaufdatum/der Ablaufzeit wie möglich festlegen. |
Erstellen Sie nach Ablauf des bestehenden Commitments das Commitment für die neue Ressource | Minimieren Sie die Ausfallzeit, indem Sie diesen und den nächsten Schritt so bald wie möglich nach dem Ablauf ausführen. |
Erstellen der Bereitstellung für die neue Ressource und Umleiten des Datenverkehrs dorthin |
Option 2: Überlappender Übergang
Diese Option hat keine Ausfallzeit, da sowohl vorhandene als auch neue Bereitstellungen gleichzeitig aktiv sind. Dies erfordert, dass das Kontingent zum Erstellen der neuen Bereitstellung verfügbar ist, und generiert zusätzliche Kosten für die Dauer der überlappenden Bereitstellungen.
Schritte | Hinweise |
---|---|
Festlegen der Verlängerungsrichtlinie für das ablaufende, bestehende Commitment | Dadurch wird verhindert, dass das Commitment verlängert wird und weitere Gebühren generiert werden. |
Vor Ablauf des vorhandenen Commitments: 1. Erstellen Sie das Commitment für die neue Ressource. 2. Erstellen Sie die neue Bereitstellung. 3. Leiten Sie den Datenverkehr um. 4. Löschen Sie die vorhandene Bereitstellung |
Stellen Sie sicher, dass Sie genügend Zeit für alle Schritte lassen, bevor das bestehende Commitment abläuft, andernfalls werden Überschreitungsgebühren für Optionen generiert (siehe nächster Abschnitt). |
Wenn der letzte Schritt länger als erwartet dauert und nach Ablauf des bestehenden Commitments abgeschlossen wird, gibt es drei Optionen, um Überschreitungsgebühren zu minimieren.
- Ausfallzeit nutzen: Löschen Sie die ursprüngliche Bereitstellung, und schließen Sie den Übergang ab.
- Überschreitung bezahlen: Behalten Sie die ursprüngliche Bereitstellung bei, und zahlen Sie stündlich, bis Sie den Datenverkehr umgeleitet und die Bereitstellung gelöscht haben.
- Zurücksetzen des ursprünglichen Commitments, um ein weiteres Mal zu verlängern. Dadurch erhalten Sie Zeit, um den Übergang mit den bekannten Kosten abzuschließen.
Sowohl die Zahlung für eine Überschreitung als auch die Zurücksetzung des ursprünglichen Commitments generieren Gebühren über das ursprüngliche Ablaufdatum hinaus. Die Zahlung von Überschreitungsgebühren kann günstiger sein als eins neues einmonatiges Commitment, wenn Sie nur einen Tag oder zwei Tage benötigen, um den Übergang abzuschließen. Vergleichen Sie die Kosten beider Optionen, um den Ansatz mit den niedrigsten Kosten zu finden.
Verschieben der Bereitstellung in eine neue Region oder ein neues Abonnement
Die gleichen Ansätze gelten beim Verschieben des Commitments und der Bereitstellung innerhalb der Region, mit der Ausnahme, dass in allen Fällen ein verfügbares Kontingent am neuen Standort erforderlich ist.
Anzeigen und Bearbeiten einer vorhandenen Ressource
Wählen Sie in Azure OpenAI Studio zunächst Kontingent>Bereitgestellt>Mindestabnahme verwalten und dann eine Ressource mit einer vorhandenen Mindestabnahme aus, um sie anzuzeigen/zu ändern.