Aktualizacja usługi Azure OpenAI aprowizowana w sierpniu 2024 r.
W połowie sierpnia 2024 r. firma Microsoft wprowadziła ulepszenia swojej oferty aprowizowanej przepływności, które dotyczą opinii klientów na temat użyteczności i elastyczności operacyjnej, które otwierają nowe opcje płatności i scenariusze wdrażania.
Ten artykuł jest przeznaczony dla istniejących użytkowników oferty aprowizowanej przepływności. Nowi klienci powinni zapoznać się z przewodnikiem dołączania aprowizacji usługi Azure OpenAI.
Co się zmienia?
Poniższe możliwości są wdrażane dla oferty aprowizowanej zarządzanej.
Ważne
Zmiany w tym artykule nie mają zastosowania do starszej oferty "Provisioned Classic (PTU-C)". Mają one wpływ tylko na aprowizowaną (znaną również jako aprowizowana) ofertę.
Ulepszenia użyteczności
Funkcja | Korzyści |
---|---|
Limit przydziału niezależny od modelu | Pojedynczy limit przydziału obejmujący wszystkie modele/wersje zmniejsza administrowanie limitami przydziału i przyspiesza eksperymentowanie z nowymi modelami. |
Żądania limitu przydziału samoobsługi | Żądanie zwiększenia limitu przydziału bez angażowania zespołu sprzedaży — wiele z tych żądań może zostać automatycznie zatwierdzonych. |
Domyślny aprowizowany przydział zarządzany w wielu regionach | Szybko rozpocznij pracę bez konieczności pierwszego żądania limitu przydziału. |
Przezroczyste informacje na temat dostępności pojemności w czasie rzeczywistym i nowego przepływu wdrażania | Zmniejszone negocjacje w sprawie dostępności przyspieszają czas obrotu. |
Nowy model komercyjny na godzinę/rezerwację
Funkcja | Korzyści |
---|---|
Godzinowe, niezatwierdzone użycie | Opcja płatności godzinowych bez wymaganego zobowiązania umożliwia scenariusze wdrażania krótkoterminowego. |
Rabaty terminowe za pośrednictwem rezerwacji platformy Azure | Rezerwacje platformy Azure zapewniają znaczne rabaty w wysokości godzinowej za jeden miesiąc i rok oraz zapewniają elastyczne zakresy, które minimalizują administrację i skojarzone z dzisiejszymi zobowiązaniami związanymi z zasobami. |
Domyślny aprowizowany przydział zarządzany w wielu regionach | Szybko rozpocznij pracę w nowych regionach bez konieczności pierwszego żądania limitu przydziału. |
Elastyczny wybór modelu płatności dla istniejących aprowizowanych klientów | Klienci z zobowiązaniami mogą pozostać w modelu zobowiązania co najmniej do końca 2024 r. i mogą zdecydować się na migrację istniejących zobowiązań do godzinowych/rezerwacji za pośrednictwem samoobsługowego lub zarządzanego procesu. |
Obsługuje najnowsze generacje modeli | Do wdrożenia modeli wydanych po 1 sierpnia 2024 r. wymagany jest model godzinowy/rezerwacja. |
Szczegóły poprawy użyteczności
Poziom szczegółowości aprowizowanego limitu przydziału zmienia się z specyficznego dla modelu na niezależny od modelu. Zamiast każdego modelu i wersji w ramach subskrypcji i regionu ma własny limit przydziału, istnieje pojedynczy element przydziału na subskrypcję i region, który ogranicza łączną liczbę jednostek PTU, które można wdrożyć we wszystkich obsługiwanych modelach i wersjach.
Limit przydziału niezależny od modelu
Od 12 sierpnia 2024 r. obecny limit przydziału specyficzny dla modelu klientów został przekonwertowany na niezależny od modelu. Dzieje się to automatycznie. W okresie przejściowym nie utracono limitu przydziału. Istniejące limity przydziału są sumowane i przypisywane do nowego elementu przydziału niezależnego od modelu.
Nowy limit przydziału niezależny od modelu jest wyświetlany jako element limitu przydziału o nazwie Provisioned Managed Throughput Unit (Jednostka aprowizowanej zarządzanej przepływności) z modelem i wersją nieuwzględnianą w nazwie. W okienku Przydział programu Studio rozwiń element limitu przydziału nadal zawiera wszystkie wdrożenia, które współtworzyją element limitu przydziału.
Domyślny limit przydziału
Nowe i istniejące subskrypcje są przypisywane niewielką ilość aprowizowanego limitu przydziału w wielu regionach. Dzięki temu klienci mogą rozpocząć korzystanie z tych regionów bez konieczności pierwszego żądania przydziału.
W przypadku istniejących klientów, jeśli region zawiera już przypisanie limitu przydziału, limit przydziału nie zostanie zmieniony dla regionu. Na przykład nie jest automatycznie zwiększana o nową kwotę domyślną.
Żądania limitu przydziału samoobsługi
Klienci nie uzyskują już limitu przydziału, kontaktując się ze swoimi zespołami sprzedaży. Zamiast tego używają formularza żądania przydziału samoobsługowego i określają typ przydziału zarządzanego przez ptU. Formularz jest dostępny z poziomu linku po prawej stronie elementu limitu przydziału. Celem jest odpowiadanie na wszystkie żądania limitu przydziału w ciągu dwóch dni roboczych.
Poniższy zrzut ekranu przydziału przedstawia przydział niezależny od modelu używany przez wdrożenia różnych typów, a także link do żądania dodatkowego limitu przydziału.
Limit przydziału jako limit
Przed sierpniową aktualizacją aprowizowanie usługi Azure OpenAI było dostępne tylko dla kilku klientów, a przydział został przydzielony w celu zmaksymalizowania możliwości ich wdrażania i używania. Dzięki tym zmianom proces uzyskiwania limitu przydziału jest uproszczony dla wszystkich użytkowników i istnieje większe prawdopodobieństwo wystąpienia ograniczeń pojemności usługi podczas próby wdrożenia. Dostępne jest nowe środowisko interfejsu API i programu Studio, które ułatwia użytkownikom znajdowanie regionów, w których subskrypcja ma limit przydziału, a usługa ma pojemność do obsługi wdrożeń żądanego modelu.
Zalecamy również, aby klienci korzystający z zobowiązań utworzyli teraz swoje wdrożenia przed utworzeniem lub rozwinięciem zobowiązań w celu ich pokrycia. Gwarantuje to, że pojemność jest dostępna przed utworzeniem zobowiązania i uniemożliwia nadmierny zakup zobowiązania. Aby to umożliwić, ograniczenie uniemożliwiające tworzenie wdrożeń większych niż ich zobowiązania zostało usunięte. To nowe podejście do limitu przydziału, dostępności pojemności i zobowiązań jest zgodne z tym, co jest dostępne w ramach modelu godzinowego/rezerwacji, a wskazówki dotyczące wdrażania przed zakupem zobowiązania (lub rezerwacji dla modelu godzinowego) są takie same dla obu tych elementów.
Aby uzyskać więcej informacji, użyj następujących linków: Wskazówki dotyczące rezerwacji i zobowiązań są takie same:
Nowy model płatności za rezerwację godzinną
Uwaga
Poniższy opis modeli płatności nie ma zastosowania do starszej oferty "Provisioned Classic (PTU-C)". Mają one wpływ tylko na ofertę aprowizowaną (aka Provisioned Managed). Aprowizowany model klasyczny nadal podlega niezmienionym miesięcznym modelowi płatności za zobowiązanie.
Firma Microsoft wprowadziła nowy model płatności "Godzinowo/rezerwacja" dla aprowizowania wdrożeń. Jest to dodatek do bieżącego modelu płatności zobowiązania , który będzie nadal obsługiwany co najmniej do końca 2024 r.
Model płatności za zobowiązanie
Regionalne, miesięczne zobowiązanie jest wymagane do korzystania z aprowizowania (dłuższe terminy dostępne umownie).
Zobowiązania są powiązane z zasobami usługi Azure OpenAI, co sprawia, że przenoszenie wdrożeń między zasobami jest trudne.
Nie można anulować ani zmienić zobowiązań w okresie obowiązywania, z wyjątkiem dodawania nowych jednostek PTU.
Obsługuje modele wydane przed 1 sierpnia 2024 r.
Model płatności za rezerwację godzinną
Model płatności jest zgodny ze standardami platformy Azure dla innych produktów.
Użycie godzinowe jest obsługiwane bez zobowiązania.
Rabaty na okres jednego miesiąca i jednego roku można kupić jako regionalne rezerwacje platformy Azure.
Rezerwacje mogą być elastycznie ograniczone do obsługi wielu subskrypcji, a zakres można zmienić w połowie okresu.
Obsługuje wszystkie modele, zarówno stare, jak i nowe.
Ważne
Modele wydane po 1 sierpnia 2024 r. wymagają użycia modelu płatności godzinowo/rezerwacji. Nie można ich wdrażać w zasobach usługi Azure OpenAI, które mają aktywne zobowiązania. Aby wdrożyć modele wydane po 1 sierpnia, istniejący klienci muszą:
- Tworzenie wdrożeń w zasobach usługi Azure OpenAI bez zobowiązań.
- Migrowanie istniejącego zasobu poza jego zobowiązania.
Struktura modelu płatności
Wraz z wydaniem modelu płatności godzinowych/zarezerwowanych opcje płatności są bardziej elastyczne, a model wokół aprowizowania płatności uległ zmianie. Gdy zobowiązania miesięczne były jedynym sposobem zakupu aprowizowania, model był:
- Uzyskaj limit przydziału jednostek PTU od zespołu kont Microsoft.
- Limit przydziału "Kup" od zobowiązania w zasobie, w którym chcesz wdrożyć.
- Utwórz wdrożenia w zasobie do limitu zobowiązania.
Kluczową różnicą między tym modelem a nowym modelem jest to, że wcześniej jedynym sposobem płacenia za aprowizację była jednorazowa zniżka terminowa. Teraz możesz wdrażać wdrożenia i płacić za wdrożenia godzinowo, jeśli wybierzesz i podejmiesz oddzielną decyzję o tym, czy zdyskontować je za pośrednictwem zobowiązania miesięcznego (na przykład wcześniej) lub rezerwacji platformy Azure.
Dzięki temu nowemu sposobowi myślenia o modelach płatności są następujące:
- Uzyskaj limit przydziału jednostek PTU przy użyciu formularza samoobsługowego.
- Tworzenie wdrożeń przy użyciu limitu przydziału.
- Opcjonalnie kup lub rozszerz zobowiązanie lub rezerwację, aby zastosować rabat terminowy do wdrożeń.
Kroki 1 i 2 są takie same we wszystkich przypadkach. Różnica polega na tym, czy zobowiązanie, czy rezerwacja platformy Azure jest używana jako pojazd w celu zapewnienia rabatu. W obu modelach:
Istnieje możliwość wdrożenia większej liczby jednostek PTU niż rabat. (na przykład utworzenie wdrożenia krótkoterminowego w celu wypróbowania nowego modelu jest włączone przez wdrożenie bez zakupu rabatu)
Metoda rabatu (zobowiązanie lub rezerwacja) stosuje obniżoną cenę do stałej liczby jednostek PTU i ma zakres określający, które wdrożenia są liczone względem rabatu.
Typ rabatu Dostępne zakresy (w regionie) Zobowiązanie Zasób usługi Azure OpenAI Wiersz 2 Grupa zasobów, pojedyncza subskrypcja, grupa zarządzania (grupa subskrypcji), udostępniona (wszystkie subskrypcje na koncie rozliczeniowym) Obniżona cena jest stosowana do wdrożonych jednostek PTU do liczby jednostek PTU z rabatem.
Liczba wdrożonych jednostek PTU przekraczających obniżone jednostki PTU (lub nie objętych żadnym rabatem) jest naliczana stawka godzinowa.
Najlepszym rozwiązaniem jest najpierw utworzenie wdrożeń, a następnie zastosowanie rabatów. Ma to zagwarantować tę usługę. pojemność jest dostępna do obsługi wdrożeń przed utworzeniem terminu zobowiązania dla jednostek PTU, których nie można użyć.
Uwaga
W przypadku stosowania najlepszych rozwiązań możesz otrzymywać opłaty godzinowe między czasem tworzenia wdrożenia a zwiększeniem rabatu (zobowiązanie lub rezerwacja).
Z tego powodu zalecamy przygotowanie się do natychmiastowego zwiększenia rabatu po wdrożeniu. Wymagania wstępne dotyczące zakupu rezerwacji platformy Azure są inne niż w przypadku zobowiązań i zalecamy ich zweryfikowanie przed wdrożeniem, jeśli zamierzasz ich używać do rabatu na wdrożenie. Aby uzyskać więcej informacji, zobacz Uprawnienia do wyświetlania rezerwacji platformy Azure i zarządzania nimi
Mapowanie wdrożeń na metodę rabatu
Klienci korzystający z usługi Azure OpenAI aprowizowanej przed sierpniem 2024 r. mogą używać modeli płatności jednocześnie w ramach subskrypcji. Model płatności używany dla każdego wdrożenia jest określany na podstawie zasobu usługi Azure OpenAI:
Zasób ma aktywne zobowiązanie
- Zobowiązanie rabatuje wszystkie wdrożenia w zasobie do liczby jednostek PTU w ramach zobowiązania. Opłaty za nadmiarowe jednostki PTU będą naliczane co godzinę.
Zasób nie ma aktywnego zobowiązania
- Wdrożenia w ramach zasobu kwalifikują się do rabatu przez rezerwację platformy Azure. Aby te wdrożenia były objęte rabatem, muszą istnieć w zakresie aktywnej rezerwacji. Wszystkie wdrożenia w zakresie rezerwacji (w tym ewentualnie wdrożenia w innych zasobach w tych samych lub innych subskrypcjach) zostaną zdyskontowane jako grupa do liczby jednostek PTU w rezerwacji. Opłaty za nadmiarowe jednostki PTU będą naliczane co godzinę.
Zmiany w istniejącym trybie płatności
Klienci, którzy mają obecnie zobowiązania, mogą nadal korzystać z nich co najmniej do końca 2024 roku. Obejmuje to zakup nowych jednostek PTU w nowych lub istniejących zobowiązaniach oraz zarządzanie zachowaniami odnawiania zobowiązania. Jednak aktualizacja z sierpnia zmieniła pewne aspekty operacji zobowiązania.
Tylko modele wydane jako aprowizowane przed 1 sierpnia 2024 r. lub wcześniej można je wdrożyć na zasobie z zobowiązaniem.
Jeśli wdrożone jednostki PTU w ramach zobowiązania przekraczają zatwierdzone jednostki PTU, opłaty za nadwyżkę godzinową będą emitowane względem tego samego miernika godzinowego, który jest używany dla nowego modelu płatności godzinowej/rezerwacji. Dzięki temu opłaty nadwyżkowe mogą być obniżone za pośrednictwem rezerwacji platformy Azure.
Istnieje możliwość wdrożenia większej liczby jednostek PTU niż zatwierdzone w zasobie. Zapewnia to możliwość zagwarantowania dostępności pojemności przed zwiększeniem rozmiaru zobowiązania do jego pokrycia.
Migrowanie istniejących zasobów poza zobowiązania
Istniejący klienci mogą zdecydować się na migrację istniejących zasobów z modelu płatności Zobowiązanie do modelu płatności godzinowo/rezerwacji, aby skorzystać z możliwości wdrożenia najnowszych modeli lub skonsolidować rabaty dla różnych wdrożeń w ramach pojedynczej rezerwacji.
Dostępne są dwa podejścia umożliwiające klientom migrowanie zasobów przy użyciu modelu zobowiązania do modelu godzinowego/rezerwacji.
Migracja samoobsługowa
Podejście do samoobsługowej migracji umożliwia klientowi organiczne korzystanie z zasobów zobowiązań, umożliwiając im wygaśnięcie. Proces migracji zasobu jest następujący:
Ustaw istniejące zobowiązanie, aby nie autorenew i zanotować datę wygaśnięcia.
Przed datą wygaśnięcia klient powinien zakupić rezerwację platformy Azure obejmującą łączną liczbę zatwierdzonych jednostek PTU na subskrypcję. Jeśli istniejąca rezerwacja ma już subskrypcję w swoim zakresie, można ją zwiększyć, aby pokryć nowe jednostki PTU.
Po wygaśnięciu zobowiązania wdrożenia w ramach zasobu zostaną automatycznie przełączone do trybu godzinowego/rezerwacji z rabatem użycia przez rezerwację.
Takie podejście do samoobsługowej migracji spowoduje nakładanie się, gdy rezerwacja i zobowiązanie są aktywne. Jest to cecha tego trybu migracji, a czas rezerwacji lub zobowiązania dla tego nakładania się nie zostanie zwrócony klientowi.
Alternatywną metodą migracji samoobsługowej jest przełączenie zakupu rezerwacji do wystąpienia po wygaśnięciu zobowiązania. W tym podejściu wdrożenia będą generować użycie godzinowe między wygaśnięciem zobowiązania a zakupem rezerwacji. Podobnie jak w przypadku poprzedniego modelu, jest to cecha tego podejścia, a użycie godzinowe nie zostanie naliczone.
Zalety migracji samoobsługowej:
- Poszczególne zasoby można migrować w różnym czasie.
- Klienci zarządzają migracją bez żadnych zależności od firmy Microsoft.
Wady migracji samoobsługowej:
- Podczas przełączania z zatwierdzonego na godzinowe rozliczenia/rozliczenia rezerwacji będą naliczane krótkie opłaty dwugodzinne lub godzinowe.
Ważne
Obie metody samoobsługi generują dodatkowe opłaty, ponieważ tryb płatności jest przełączany z Zatwierdzone na Wartość godzinowa/Rezerwacja. Są to cechy metod migracji, a klienci nie są naliczani za te opłaty. Klienci mogą zdecydować się na użycie podejścia do migracji zarządzanej opisanej poniżej, aby ich uniknąć.
Migracja zarządzana
Podejście do migracji zarządzanej obejmuje współpracowanie klienta z firmą Microsoft w celu zbiorczej migracji wszystkich zobowiązań PTU w ramach subskrypcji/regionu w tym samym czasie. Działa to w ten sposób:
- Klient skontaktuje się z zespołem ds. kont i zażąda zarządzanej migracji. Właściciel migracji od zespołu firmy Microsoft zostanie przypisany, aby pomóc klientowi w migracji.
- Data zostanie wybrana, gdy wszystkie zasoby w poszczególnych subskrypcjach klientów i regionach zawierających bieżące zobowiązania PTU zostaną zmigrowane z zatwierdzonego do modelu rozliczeniowego godzinowego/rezerwacji. Wiele subskrypcji i regionów można migrować w tym samym dniu.
- Zgodnie z uzgodnioną datą:
- Klient zakupi rezerwacje regionalne w celu pokrycia zatwierdzonych jednostek PTU, które zostaną przekonwertowane i przekażą informacje o rezerwacji do kontaktu z migracją firmy Microsoft.
- W ciągu 2–3 dni roboczych wszystkie zobowiązania zostaną aktywnie anulowane, a wdrożenia wcześniej w ramach zobowiązań zaczną korzystać z modelu płatności godzinowej/rezerwacji.
- W okresie rozliczeniowym po zakupie rezerwacji klient otrzyma kredyt na zakup rezerwacji obejmujący część anulowanych zobowiązań, począwszy od momentu zakupu rezerwacji.
Klienci muszą skontaktować się ze swoimi zespołami ds. kont, aby zaplanować migrację zarządzaną.
Korzyści z migracji zarządzanej:
- Migracja zbiorcza wszystkich zobowiązań w ramach subskrypcji/regionu jest korzystna dla klientów z wieloma zobowiązaniami.
- Bezproblemowa migracja kosztów: brak możliwości podwójnego naliczania opłat lub dodatkowych opłat godzinowych.
Wady migracji zarządzanej:
- Wszystkie zobowiązania w subskrypcji/regionie muszą być migrowane w tym samym czasie.
- Konieczne jest koordynowanie czasu migracji z zespołem firmy Microsoft.
Zarządzanie zobowiązaniami aprowizowanej przepływności
Zobowiązania dotyczące aprowizowanej przepływności są tworzone i zarządzane z poziomu menu Zarządzanie zobowiązaniami w programie Azure OpenAI Studio. Aby przejść do tego widoku, wybierz pozycję Zarządzaj zobowiązaniami z menu Limit przydziału:
W widoku Zarządzanie zobowiązaniami można wykonać kilka czynności:
- Kupowanie nowych zobowiązań lub edytowanie istniejących zobowiązań.
- Monitoruj wszystkie zobowiązania w ramach subskrypcji.
- Zidentyfikuj i podejmij działania dotyczące zobowiązań, które mogą powodować nieoczekiwane rozliczenia.
Poniższe sekcje przejmą Cię przez te zadania.
Zakup aprowizowanego zobowiązania dotyczącego przepływności
Gdy plan zobowiązania będzie gotowy, następnym krokiem jest utworzenie zobowiązań. Zobowiązania są tworzone ręcznie za pośrednictwem usługi Azure OpenAI Studio i wymagają od użytkownika utworzenia zobowiązania w celu posiadania roli Współautor lub Współautor usług Cognitive Services na poziomie subskrypcji.
Dla każdego nowego zobowiązania, które należy utworzyć, wykonaj następujące kroki:
- Uruchom okno dialogowe Aprowizowanie zakupu przepływności, wybierając pozycję Limit przydziału>Aprowizowanie>planów zobowiązania dla usługi Azure OpenAI.
Wybierz pozycję Zobowiązanie zakupu.
Wybierz zasób Azure OpenAI i kup zobowiązanie. Zasoby zostaną podzielone na zasoby z istniejącymi zobowiązaniami, które można edytować i zasoby, które nie mają obecnie zobowiązania.
Ustawienie | Uwagi |
---|---|
Wybierz zasób | Wybierz zasób, w którym utworzysz aprowizowane wdrożenie. Po zakupie zobowiązania nie będzie można używać jednostek PTU w innym zasobie do momentu wygaśnięcia bieżącego zobowiązania. |
Wybierz typ zobowiązania | Wybierz pozycję Aprowizowana. (Aprowizowany jest odpowiednikiem aprowizowania zarządzanego) |
Bieżący niezatwierdzony przydział aprowizacji | Liczba jednostek PTU, które są obecnie dostępne do zatwierdzenia tego zasobu. |
Kwota zatwierdzenia (PTU) | Wybierz liczbę jednostek PTU, do których zobowiązujesz się. Tę liczbę można zwiększyć w okresie zobowiązania, ale nie można jej zmniejszyć. Wprowadź wartości w przyrostach 50 dla typu zobowiązania Zainicjowano obsługę administracyjną. |
Warstwa zobowiązania dla bieżącego okresu | Okres zobowiązania jest ustawiony na jeden miesiąc. |
Ustawienia odnawiania | Autorenew na bieżących jednostkach PTU Autorenew przy niższych jednostkach PTU Nie autorenuj |
- Wybierz pozycję Kup. Zostanie wyświetlone okno dialogowe potwierdzenia. Po potwierdzeniu jednostki PTU zostaną zatwierdzone i można ich użyć do utworzenia aprowizowanego wdrożenia. |
Ważne
Nowe zobowiązanie jest rozliczane z góry za cały okres. Jeśli ustawienia odnawiania są ustawione na automatyczne odnawianie, opłaty będą naliczane ponownie na każdą datę odnowienia na podstawie ustawień odnawiania.
Edytowanie istniejącego zobowiązania aprowizowanej przepływności
W widoku Zarządzanie zobowiązaniami możesz również edytować istniejące zobowiązanie. Istnieją dwa typy zmian, które można wprowadzić do istniejącego zobowiązania:
- Możesz dodać jednostki PTU do zobowiązania.
- Możesz zmienić ustawienia odnawiania.
Aby edytować zobowiązanie, wybierz bieżący element do edycji, a następnie wybierz pozycję Edytuj zobowiązanie.
Dodawanie aprowizowanych jednostek przepływności do istniejących zobowiązań
Dodanie jednostek PTU do istniejącego zobowiązania umożliwi utworzenie większych lub większej liczby wdrożeń w ramach zasobu. Możesz to zrobić w dowolnym momencie w okresie zobowiązania.
Ważne
Po dodaniu jednostek PTU do zobowiązania będą one rozliczane natychmiast na podstawie proporcjonalnej kwoty od bieżącej daty do końca istniejącego okresu zobowiązania. Dodanie jednostek PTU nie powoduje zresetowania terminu zobowiązania.
Zmienianie ustawień odnawiania
Ustawienia odnowienia zobowiązania można zmienić w dowolnym momencie przed datą wygaśnięcia zobowiązania. Powody, dla których warto zmienić ustawienia odnawiania, obejmują zakończenie korzystania z aprowizowanej przepływności przez ustawienie zobowiązania, aby nie autorenewować, lub zmniejszenie użycia aprowizowanej przepływności przez obniżenie liczby jednostek PTU, które zostaną zatwierdzone w następnym okresie.
Ważne
Jeśli zezwolisz na wygaśnięcie lub zmniejszenie rozmiaru zobowiązania, tak aby wdrożenia w ramach zasobu wymagały więcej jednostek PTU niż w ramach zobowiązania dotyczącego zasobów, otrzymasz opłaty godzinowe za nadwyżkowe jednostki PTU. Na przykład zasób, który zawiera wdrożenia obejmujące łącznie 500 jednostek PTU i zobowiązanie dla 300 jednostek PTU, spowoduje wygenerowanie opłat za nadwyżkowe opłaty godzinowe za 200 jednostek PTU.
Monitorowanie zobowiązań i zapobieganie nieoczekiwanym rozliczeniom
Okienko Zarządzanie zobowiązaniami zawiera szeroki przegląd wszystkich zasobów z zobowiązaniami i użyciem jednostek PTU w ramach danej subskrypcji platformy Azure. Szczególnie ważne są następujące istotnych elementów:
- Jednostki PTU Zatwierdzone, Wdrożone i Użycie — te dane zawierają rozmiary zobowiązań i ilość używanych przez wdrożenia. Maksymalizuj inwestycję przy użyciu wszystkich zatwierdzonych jednostek PTU.
- Zasady wygasania i data — data wygaśnięcia i zasady informują, kiedy zobowiązanie wygaśnie i co się stanie, gdy tak się stanie. Zobowiązanie ustawione na autorenew spowoduje wygenerowanie zdarzenia rozliczeniowego w dniu odnowienia. W przypadku zobowiązań wygasających upewnij się, że wdrożenia zostały usunięte z tych zasobów przed datą wygaśnięcia, aby zapobiec naliczaniu godzinowymZaliczanie godzinOweUstawienia bieżącego odnowienia zobowiązania.
- Powiadomienia — alerty dotyczące ważnych warunków, takich jak nieużywane zobowiązania i konfiguracje, które mogą powodować nadwyżki rozliczeń. Nadwyżki rozliczeń mogą być spowodowane sytuacjami, takimi jak wygaśnięcie zobowiązania, a wdrożenia są nadal obecne, ale zostały przeniesione do rozliczeń godzinowych.
Typowe scenariusze zarządzania zobowiązaniem
Zaprzestanie korzystania z aprowizowanej przepływności
Aby zakończyć korzystanie z aprowizowanej przepływności i zapobiec naliczaniu opłat godzinowych po wygaśnięciu zobowiązania, należy zatrzymać wszelkie opłaty po wygaśnięciu bieżących zobowiązań, należy wykonać dwa kroki:
- Ustaw zasady odnawiania dla wszystkich zobowiązań nie autorenew.
- Usuń aprowidowane wdrożenia przy użyciu limitu przydziału.
Przenoszenie zobowiązania/wdrożenia do nowego zasobu w tej samej subskrypcji/regionie
W usłudze Azure OpenAI Studio nie można bezpośrednio przenieść wdrożenia ani zobowiązania do nowego zasobu. Zamiast tego należy utworzyć nowe wdrożenie w zasobie docelowym i przenieść do niego ruch. Aby to osiągnąć, konieczne będzie zobowiązanie zakupione na podstawie nowego zasobu. Ponieważ zobowiązania są naliczane z góry przez okres 30 dni, konieczne jest, aby ten ruch upływał wraz z wygaśnięciem pierwotnego zobowiązania, aby zminimalizować nakładanie się na nowe zobowiązanie i "podwójne rozliczenia" podczas nakładania się.
Istnieją dwa podejścia, które można zastosować do wdrożenia tego przejścia.
Opcja 1. Przełączanie bez nakładania się
Ta opcja wymaga przestoju, ale nie wymaga dodatkowego limitu przydziału i nie generuje dodatkowych kosztów.
Kroki | Uwagi |
---|---|
Ustawianie zasad odnawiania istniejącego zobowiązania w celu wygaśnięcia | Uniemożliwi to odnowienie i wygenerowanie dalszych opłat przez zobowiązanie |
Przed wygaśnięciem istniejącego zobowiązania usuń wdrożenie | Przestój rozpocznie się w tym momencie i będzie trwać do momentu utworzenia nowego wdrożenia i przeniesienia ruchu. Zminimalizujesz czas trwania, określając czas usunięcia tak blisko daty/godziny wygaśnięcia, jak to możliwe. |
Po wygaśnięciu istniejącego zobowiązania utwórz zobowiązanie dotyczące nowego zasobu | Zminimalizuj przestój, wykonując ten i następny krok jak najszybciej po wygaśnięciu. |
Tworzenie wdrożenia w nowym zasobie i przenoszenie ruchu do niego |
Opcja 2. Nakładające się przełączanie
Ta opcja nie ma przestoju, ponieważ zarówno istniejące, jak i nowe wdrożenia działają w tym samym czasie. Wymaga to udostępnienia limitu przydziału w celu utworzenia nowego wdrożenia i spowoduje wygenerowanie dodatkowych kosztów na czas trwania nakładających się wdrożeń.
Kroki | Uwagi |
---|---|
Ustawianie zasad odnawiania istniejącego zobowiązania w celu wygaśnięcia | Zapobiega to odnowieniu i wygenerowaniu dodatkowych opłat przez zobowiązanie. |
Przed wygaśnięciem istniejącego zobowiązania: 1. Utwórz zobowiązanie dotyczące nowego zasobu. 2. Utwórz nowe wdrożenie. 3. Przełącz ruch 4. Usuwanie istniejącego wdrożenia |
Upewnij się, że pozostawisz wystarczająco dużo czasu na wszystkie kroki przed wygaśnięciem istniejącego zobowiązania. W przeciwnym razie opłaty nadwyżkowe zostaną wygenerowane (zobacz następną sekcję) dla opcji. |
Jeśli ostatni krok trwa dłużej niż oczekiwano i zakończy się po wygaśnięciu istniejącego zobowiązania, istnieją trzy opcje zminimalizowania opłat za nadwyżki.
- Przestój: usuń oryginalne wdrożenie, a następnie zakończ przenoszenie.
- Nadwyżka płatności: zachowaj oryginalne wdrożenie i zapłać co godzinę, dopóki nie przeniesiesz ruchu i usuniesz wdrożenie.
- Zresetuj oryginalne zobowiązanie , aby odnowić jeszcze raz. Pozwoli to na ukończenie przenoszenia ze znanym kosztem.
Zarówno płacenie za nadwyżkę, jak i zresetowanie pierwotnego zobowiązania spowoduje wygenerowanie opłat przekraczających pierwotną datę wygaśnięcia. Płacenie opłat nadwyżkowych może być tańsze niż nowe zobowiązanie jednomiesięczny, jeśli potrzebujesz tylko jednego lub dwóch dni do ukończenia przenoszenia. Porównaj koszty obu opcji, aby znaleźć podejście o najniższych kosztach.
Przenoszenie wdrożenia do nowego regionu i subskrypcji
Te same podejścia mają zastosowanie w przeniesieniu zobowiązania i wdrożenia w regionie, z tą różnicą, że we wszystkich przypadkach będzie wymagane posiadanie dostępnego limitu przydziału w nowej lokalizacji.
Wyświetlanie i edytowanie istniejącego zasobu
W usłudze Azure OpenAI Studio wybierz pozycję Aprowizowane>przydziały>Zarządzaj zobowiązaniami i wybierz zasób z istniejącym zobowiązaniem, aby go wyświetlić/zmienić.