Przejście do rezerwacji wdrożeń aprowizowania usługi Azure OpenAI
Platforma Azure wprowadziła nowe rezerwacje wdrożenia globalnego i stref danych dla usługi Azure OpenAI. Te nowe opcje zapewniają większą elastyczność i skalowalność, umożliwiając dostęp do potrzebnych modeli i skalowanie jednostek przepływności aprowizowanej w celu zapewnienia obsługi wzrostu użycia. Ponadto firma Microsoft ogłosiła niższe ceny godzinowe i mniejsze minimum wdrożenia dla nowych typów wdrożeń, chociaż ceny miesięcznych i rocznych rezerwacji pozostają niezmienione.
Dzięki tym zmianom platforma Azure oczekuje, że będzie lepiej obsługiwać zmieniające się potrzeby. Jeśli obecnie używasz wdrożeń zaaprowizowanych w regionie, może się okazać, że przejście do wdrożeń aprowizowanych w strefie globalnej lub strefy danych zapewnia znaczne korzyści. Ten przewodnik ułatwia zrozumienie procesu przejścia, w tym sposobu migrowania aplikacji i wdrożeń oraz sposobu przenoszenia istniejących rezerwacji obejmujących wdrożenia.
Zmiany wdrożeń aprowizowania usługi Azure OpenAI
- We wrześniu 2024 r. platforma Azure uruchomiła globalne rezerwacje wdrożenia aprowizowania.
- W grudniu 2024 r. platforma Azure uruchomiła rezerwacje wdrożenia aprowizowania strefy danych.
- Mimo że większość klientów korzysta obecnie z wdrożeń aprowizowania regionalnego, wdrożenia aprowizowania globalnej i strefy danych mogą lepiej odpowiadać Twoim potrzebom, jeśli chcesz:
- Uzyskaj dostęp do potrzebnego modelu.
- Skaluj jednostki PTU, aby obsługiwać wzrost użycia.
- W przypadku wdrożeń aprowizacji globalnych i stref danych firma Microsoft ogłosiła niższe ceny godzinowe i mniejsze minimum wdrożenia. Nie ma żadnych zmian w cenie miesięcznych i rocznych rezerwacji z tym ogłoszeniem.
- Po uruchomieniu wdrożeń aprowizowania globalnych i stref danych platforma Azure oferuje teraz usługi, które lepiej zaspokajają zmieniające się potrzeby.
Przejście z wdrożeń aprowizowanych w regionie regionalnym na globalne lub aprowizowane strefy danych
Jeśli chcesz przejść z wdrożenia aprowizowania regionalnego do wdrożeń globalnych lub stref danych, musisz przeprowadzić migrację aplikacji lub wdrożeń po stronie usługi. Musisz również przenieść rezerwacje, jeśli istnieją, które obejmują te wdrożenia.
Przenoszenie wdrożeń usługi Azure OpenAI z regionu na strefę globalną lub strefę danych
Jeśli używasz istniejących wdrożeń aprowizowania regionalnego usługi Azure OpenAI, istnieją dwie opcje przejścia do strefy danych lub typów wdrożeń aprowizacji globalnej:
Opcja 1 — brak przestoju
- Utwórz nowe wdrożenie przy użyciu globalnej aprowizacji usługi Azure OpenAI lub typu wdrożenia Aprowizowanie strefy danych w żądanym zasobie usługi Azure OpenAI Service.
- Przeniesienie ruchu z istniejącego wdrożenia regionalnego usługi Azure OpenAI Service do nowo utworzonego wdrożenia usługi Azure OpenAI Service Global lub Data Zone provisioned do momentu odciążania całego ruchu z wdrożenia aprowizacji regionalnej.
- Usuń istniejące wdrożenie aprowizowania regionalnego.
Opcja 2 — ma przestój
- Upewnij się, że wszystkie żądania interfejsu API usługi Azure OpenAI są zatrzymywane we wdrożeniu regionalnym aprowizacji usługi Azure OpenAI.
- Usuń istniejące wdrożenie aprowizowania regionalnego.
- Utwórz nowe wdrożenie przy użyciu globalnej aprowizacji usługi Azure OpenAI lub typu wdrożenia Aprowizowanie strefy danych w żądanym zasobie usługi Azure OpenAI Service.
Przenoszenie rezerwacji aprowizowania usługi Azure OpenAI z regionu do strefy globalnej lub danych
- Najpierw musisz zdecydować, ile jednostek PTU chcesz zachować we wdrożeniu aprowizacji regionalnej. Następnie zdecyduj, ile jednostek PTU ma przejść do aprowizowania wdrożeń globalnych lub stref danych.
- W przypadku tych wdrożeń musisz zdecydować, ile musi być objętych rezerwacjami, aby uzyskać obniżoną cenę.
- Rezerwacje wdrożeń globalnych, stref danych i regionalnych nie mogą ulec zmianie. Musisz kupić oddzielną rezerwację dla każdego typu wdrożenia.
- Jeśli masz istniejące wdrożenia aprowizowania regionalnego i chcesz przejść do wdrożeń aprowizowania globalnych lub stref danych, oba typy wdrożeń mogą istnieć przez krótki czas, aby przeprowadzić migrację aplikacji. Powoduje to właściwe ustalanie rozmiaru wdrożeń aprowizowania regionalnego.
- Na podstawie żądanego stanu końcowego (wdrożeń w regionie, strefie danych i skali globalnej) musisz anulować istniejące rezerwacje i zakupić nowe rezerwacje, które obejmują wdrożenia.
- Może to spowodować jeden z dwóch scenariuszy:
- Nakładanie się istniejących i nowo zakupionych rezerwacji, co powoduje naliczanie opłat za obie te rezerwacje.
- Okres między anulowaniem istniejących rezerwacji a zakupem nowych rezerwacji, co powoduje naliczanie opłat za wdrożenia według stawki godzinowej (zamiast ceny rezerwacji, ponieważ nie byłoby żadnych rezerwacji obejmujących te wdrożenia).
- W obu przypadkach nie jest to uważane za podwójne rozliczenia, ale niezbędne do przejścia z jednego wdrożenia do drugiego.
- Staranne planowanie przejścia wdrożeń i przejścia rezerwacji minimalizuje opłaty.
- Podczas przenoszenia wdrożeń upewnij się, że administrator rezerwacji rozumie żądany stan zakończenia. Następnie możesz anulować i kupić odpowiednią liczbę jednostek rezerwacji dla odpowiednich typów wdrożeń.
- Unikaj naliczania godzinowych opłat za wdrożenia, zapewniając, że wszystkie wdrożenia mają zgodną rezerwację.
- Unikaj zakupu rezerwacji przed upływem czasu, aby zapobiec naliczaniu opłat za wdrożenia, które nie są jeszcze aktywne.
- Anuluj rezerwacje, które nie obejmują żadnych wdrożeń.
- Istniejące aprowizowane regionalne anulowanie rezerwacji jest zatwierdzane podczas zakupu nowych rezerwacji globalnych lub rezerwacji strefy danych w celu zastąpienia lub wymiany istniejących rezerwacji.
Uwaga
Anulowania są obsługiwane przez ograniczony czas. Jeśli chcesz przejść do rezerwacji globalnych lub rezerwacji strefy danych, należy zatrzymać automatyczne odnawianie dla zaaprowizowanych rezerwacji regionalnych.
Scenariusz 1 — roczne rezerwacje
Anuluj istniejące aprowizowane rezerwacje regionalne dla liczby jednostek PTU, które chcesz przenieść do strefy globalnej lub strefy danych.
Aby uwzględnić wdrożenia, które chcesz przenieść, kup odpowiednie rezerwacje globalne lub rezerwacje strefy danych.
Załóżmy na przykład, że masz 300 jednostek PTU we wdrożeniu regionalnym. Postanawiasz przenieść 200 jednostek PTU do wdrożenia strefy danych i zachować pozostałe 100 wdrożeń regionalnych. Załóżmy również, że masz co najmniej jedną rezerwację, która obejmuje wszystkie 300 istniejących wdrożeń regionalnych.
- Aby skonsolidować i skonsolidować rezerwacje, musisz anulować istniejące rezerwacje dla 300 jednostek PTU.
- Aby objęć wdrożenia strefy danych 200, kup rezerwację strefy danych.
- Kup rezerwację regionalną, aby pokryć 100 wdrożeń regionalnych.
Jeśli uważasz, że wystąpił błąd lub należny kredyt, możesz utworzyć wniosek o pomoc techniczną.
Scenariusz 2 — miesięczne rezerwacje
W tym scenariuszu dostępne są dwie opcje:
Opcja 1 — zalecana dla pojedynczej miesięcznej rezerwacji
Niech bieżące miesięczne rezerwacje wygasają samodzielnie. Na przykład zatrzymaj automatyczne odnawianie istniejących rezerwacji.
Aby skonsolidować i zrównać rezerwacje, kup odpowiednie rezerwacje globalne, strefę danych lub rezerwacje regionalne. Obejmują one wdrożenia, do których chcesz przejść.
Załóżmy na przykład, że masz 300 jednostek PTU we wdrożeniu regionalnym. Postanawiasz przenieść 200 jednostek PTU do wdrożenia strefy danych i zachować pozostałe 100 wdrożeń regionalnych. Załóżmy również, że masz jedną rezerwację, która obejmuje wszystkie 300 istniejących wdrożeń regionalnych.
- Aby realizować rezerwacje, należy zatrzymać automatyczne odnawianie istniejącej rezerwacji obejmującej 300 jednostek PTU.
- W tym samym lub następnym dniu, kiedy rezerwacja wygaśnie, kup rezerwację strefy danych w celu pokrycia wdrożeń strefy danych 200. Kup rezerwację regionalną, aby pokryć 100 wdrożeń regionalnych.
- Prawidłowy harmonogram nowych zakupów pomaga uniknąć nakładania się na siebie rezerwacji lub naliczania opłat według godzinowych stawek płatności zgodnie z rzeczywistym użyciem.
Jeśli uważasz, że wystąpił błąd lub należny kredyt, możesz utworzyć wniosek o pomoc techniczną.
Opcja 2 — zalecana w przypadku wielu miesięcznych rezerwacji
- Wykonaj kroki opisane w scenariuszu 1 — roczne rezerwacje.
Ważna informacja
Ostrzeżenie
Jeśli anulujesz bieżące rezerwacje PTU, ale nie kupisz nowych rezerwacji jednostek PTU globalnych lub stref danych, wszystkie wdrożenia PTU będą naliczane za cenę godzinową.
Rezerwacje można anulować samodzielnie, jeśli kwota jest mniejsza lub równa 50 000 USD. W przeciwnym razie musisz skontaktować się z pomoc techniczna platformy Azure, aby zażądać anulowania. Aby skontaktować się z pomocą techniczną w celu anulowania, zobacz tworzenie wniosku o pomoc techniczną.
Anulowania są obsługiwane przez ograniczony czas. Jeśli chcesz przejść do rezerwacji globalnych lub rezerwacji strefy danych, należy zatrzymać automatyczne odnawianie dla aprowizowania rezerwacji regionalnych.