Transition vers les réservations de déploiement provisionnées d’Azure OpenAI Service
Azure a introduit de nouvelles réservations de déploiement provisionnées au niveau global et dans la zone de données pour Azure OpenAI Service. Ces nouvelles options offrent davantage de flexibilité et d'évolutivité, vous permettant d'accéder aux modèles dont vous avez besoin et de faire évoluer les unités de débit provisionnées (PTU) pour prendre en charge la croissance de l'utilisation. En outre, Microsoft a annoncé des tarifs horaires plus bas et des minimums de déploiement plus petits pour les nouveaux types de déploiement, bien que les prix des réservations mensuelles et annuelles restent inchangés.
Grâce à ces changements, Azure espère mieux répondre à vos besoins en constante évolution. Si vous utilisez actuellement des déploiements provisionnés régionaux, vous constaterez peut-être que la transition vers des déploiements provisionnés globaux ou de zone de données offre des avantages significatifs. Ce guide vous aide à comprendre le processus de transition, notamment comment migrer vos applications et déploiements et comment effectuer la transition de toutes les réservations existantes qui couvrent les déploiements.
Modifications apportées aux déploiements provisionnés d’Azure OpenAI Service
- En septembre 2024, Azure a lancé les réservations de déploiement provisionnées à l’échelle mondiale.
- En décembre 2024, Azure a lancé les réservations de déploiement provisionnées par Data Zone.
- Bien que la plupart des clients utilisent actuellement des déploiements provisionnés régionaux, les déploiements provisionnés mondiaux et de zone de données peuvent mieux répondre à vos besoins si vous souhaitez :
- Accédez au modèle dont vous avez besoin.
- Faites évoluer les PTU pour soutenir la croissance de votre utilisation.
- Pour les déploiements provisionnés à l'échelle mondiale et dans les zones de données, Microsoft a annoncé des tarifs horaires plus bas et des minimums de déploiement plus petits. Il n'y a aucun changement au prix des réservations mensuelles et annuelles avec cette annonce.
- Avec le lancement des déploiements provisionnés Global et Data Zone, Azure propose désormais des services qui répondent mieux à vos besoins en constante évolution.
Transition des déploiements provisionnés régionaux vers les déploiements globaux ou de zone de données
Si vous souhaitez passer d'un déploiement provisionné régional à des déploiements globaux ou de zone de données, vous devez migrer votre application ou vos déploiements côté service. Et vous devez effectuer la transition des réservations, le cas échéant, qui couvrent ces déploiements.
Transition des déploiements d’Azure OpenAI Service d'une zone régionale vers une zone globale ou une zone de données
Si vous utilisez des déploiements Azure OpenAI Service Regional Provisioned existants, il existe deux options pour passer aux types de déploiement Data Zone ou Global Provisioned :
Option 1 – Pas de temps d’arrêt
- Créez un nouveau déploiement à l’aide du type de déploiement Azure OpenAI Service Global Provisioned ou Data Zone Provisioned dans la ressource Azure OpenAI Service souhaitée.
- Transférez le trafic du déploiement provisionné régional Azure OpenAI Service existant vers le déploiement provisionné global ou de zone de données Azure OpenAI Service nouvellement créé jusqu’à ce que tout le trafic soit déchargé du déploiement provisionné régional.
- Supprimez le déploiement régional provisionné existant.
Option 2 – A des temps d’arrêt
- Assurez-vous que toutes les demandes d’API Azure OpenAI Service sont arrêtées sur le déploiement provisionné régional Azure OpenAI Service.
- Supprimez le déploiement régional provisionné existant.
- Créez un nouveau déploiement à l’aide du type de déploiement Azure OpenAI Service Global Provisioned ou Data Zone Provisioned dans la ressource Azure OpenAI Service souhaitée.
Transition des réservations provisionnées d’Azure OpenAI Service de la zone régionale vers la zone globale ou la zone de données
- Tout d’abord, vous devez décider du nombre de PTU que vous souhaitez conserver sur le déploiement régional provisionné. Décidez ensuite du nombre de PTU à déplacer vers les déploiements globaux ou de zone de données provisionnés.
- Parmi ces déploiements, vous devez décider combien doivent être couverts par des réservations pour bénéficier du prix réduit.
- Les réservations pour les déploiements mondiaux, de zone de données et régionaux ne sont pas interchangeables. Vous devez acheter une réservation distincte pour chaque type de déploiement.
- Lorsque vous disposez de déploiements provisionnés régionaux existants et que vous souhaitez passer à des déploiements provisionnés globaux ou de zone de données, les deux types de déploiements peuvent devoir exister pendant une brève période pour migrer vos applications. Cela vous permet de dimensionner correctement vos déploiements provisionnés au niveau régional.
- En fonction de l'état final souhaité (déploiements au niveau régional, de la zone de données et mondial), vous devez annuler vos réservations existantes et acheter de nouvelles réservations couvrant vos déploiements.
- Cela pourrait aboutir à l'un des deux scénarios suivants :
- Chevauchement des réservations existantes et nouvellement achetées, entraînant la facturation des deux.
- Période de temps entre l’annulation des réservations existantes et l’achat de nouvelles réservations, entraînant la facturation des déploiements au tarif horaire (au lieu d’un prix de réservation, car il n’y aurait aucune réservation couvrant ces déploiements).
- Dans les deux cas, cela n’est pas considéré comme une double facturation, mais essentiel pour passer d’un déploiement à un autre.
- Une planification minutieuse des déploiements de transition et des réservations de transition minimise les frais.
- Lorsque vous effectuez la transition des déploiements, assurez-vous que l’administrateur de réservation comprend l’état final souhaité. Vous pouvez ensuite annuler et acheter le nombre approprié d’unités de réservation pour les types de déploiement respectifs.
- Évitez les frais horaires pour les déploiements en vous assurant que tous les déploiements ont une réservation correspondante.
- Évitez d’acheter des réservations à l’avance pour éviter des frais pour les déploiements qui ne sont pas encore actifs.
- Annulez les réservations qui ne couvrent aucun déploiement.
- L'annulation d'une réservation régionale provisionnée existante est approuvée lorsque vous achetez de nouvelles réservations globales ou de zone de données pour remplacer ou échanger vos réservations existantes.
Remarque
Les annulations sont prises en charge pendant une durée limitée. Vous devez arrêter les renouvellements automatiques de vos réservations régionales provisionnées si vous souhaitez passer aux réservations globales ou de zone de données.
Scénario 1 – Réservations annuelles
Annulez vos réservations régionales provisionnées existantes pour le nombre de PTU que vous souhaitez transférer vers la zone globale ou la zone de données.
Pour couvrir les déploiements que vous souhaitez transférer, achetez des réservations globales ou de zone de données correspondantes.
Par exemple, supposons que vous disposez de 300 PTU sur le déploiement régional. Vous décidez de transférer 200 PTU vers un déploiement en zone de données et de conserver les 100 restants sur un déploiement régional. Supposons également que vous disposez d’une ou plusieurs réservations pour couvrir l’ensemble des 300 déploiements régionaux existants.
- Pour consolider et réaligner les réservations, vous devez annuler vos réservations existantes pour 300 PTU.
- Pour couvrir les 200 déploiements de zone de données, achetez une réservation de zone de données.
- Achetez une réservation régionale pour couvrir les 100 déploiements régionaux.
Si vous pensez qu’il y a une erreur ou qu’un crédit est dû, vous pouvez créer une requête d’assistance.
Scénario 2 – Réservations mensuelles
Dans ce scénario, vous avez deux options :
Option 1 - Recommandé pour une seule réservation mensuelle
Laissez vos réservations mensuelles actuelles expirer d’elles-mêmes. Par exemple, arrêtez le renouvellement automatique de vos réservations existantes.
Pour consolider et réaligner les réservations, achetez les réservations globales, de zone de données ou régionales correspondantes. Ils couvrent les déploiements vers lesquels vous souhaitez effectuer la transition.
Par exemple, supposons que vous disposez de 300 PTU sur le déploiement régional. Vous décidez de transférer 200 PTU vers un déploiement en zone de données et de conserver les 100 restants sur un déploiement régional. Supposons également que vous disposez d’une seule réservation pour couvrir l’ensemble des 300 déploiements régionaux existants.
- Pour réaligner les réservations, vous devez arrêter le renouvellement automatique de la réservation existante qui couvre les 300 PTU.
- Le jour même ou le jour suivant l'expiration d'une réservation, achetez une réservation de zone de données pour couvrir les 200 déploiements de zone de données. Achetez une réservation régionale pour couvrir les 100 déploiements régionaux.
- Le bon timing des nouveaux achats permet d'éviter les chevauchements de réservations ou d'être facturé au tarif horaire.
Si vous pensez qu’il y a une erreur ou qu’un crédit est dû, vous pouvez créer une requête d’assistance.
Option 2 - Recommandé pour plusieurs réservations mensuelles
- Suivez les étapes du Scénario 1 – Réservations annuelles.
Informations importantes
Avertissement
Si vous annulez vos réservations PTU actuelles mais n'achetez pas les nouvelles réservations PTU globales ou de zone de données, tous vos déploiements PTU sont facturés au prix horaire.
Vous pouvez annuler vous-même les réservations si le montant est inférieur ou égal à 50 000 $. Dans le cas contraire, vous devez contacter le support Azure pour demander l’annulation. Pour contacter le support en cas d'annulation, consultez Créer une requête d'assistance.
Les annulations sont prises en charge pendant une durée limitée. Vous devez arrêter les renouvellements automatiques de vos réservations régionales provisionnées si vous souhaitez passer aux réservations globales ou de zone de données.