Delen via


Azure OpenAI ingericht voor update van augustus 2024

Medio augustus 2024 heeft Microsoft verbeteringen geïntroduceerd in de ingerichte doorvoer die betrekking hebben op feedback van klanten over bruikbaarheid en operationele flexibiliteit die nieuwe betalingsopties en implementatiescenario's openen.

Dit artikel is bedoeld voor bestaande gebruikers van de ingerichte doorvoeraanbiedingen. Nieuwe klanten moeten verwijzen naar de ingerichte onboardinghandleiding voor Azure OpenAI.

Wat wordt gewijzigd?

De onderstaande mogelijkheden worden geïmplementeerd voor de ingerichte beheerde aanbieding.

Belangrijk

De wijzigingen in dit artikel zijn niet van toepassing op de oudere aanbieding Ingerichte klassieke versie (PTU-C). Ze zijn alleen van invloed op de aanbieding Ingericht (ook wel ingericht beheerd genoemd).

Bruikbaarheidsverbeteringen

Functie Voordeel
Modelonafhankelijk quotum Eén quotumlimiet voor alle modellen/versies vermindert het quotumbeheer en versnelt experimenten met nieuwe modellen.
Selfservicequotumaanvragen Verhogingen van het quotum aanvragen zonder het verkoopteam in te schakelen. Veel kunnen automatisch worden goedgekeurd.
Standaard ingerichte beheerde quota in veel regio's Ga snel aan de slag zonder dat u eerst quotum hoeft aan te vragen.
Transparante informatie over beschikbaarheid van realtime capaciteit + nieuwe implementatiestroom Beperkte onderhandeling over beschikbaarheid versnelt de time-to-market.

Nieuw commercieel model per uur/reservering

Functie Voordeel
Gebruik per uur, niet-verzonden De optie voor betaling per uur zonder een vereiste toezegging maakt implementatiescenario's voor de korte termijn mogelijk.
Termijnkortingen via Azure-reserveringen Azure-reserveringen bieden aanzienlijke kortingen ten opzichte van het uurtarief voor één maand en één jaar, en bieden flexibele bereiken waarmee het beheer wordt geminimaliseerd en gekoppeld aan de huidige resourcegebonden toezeggingen.
Standaard ingerichte beheerde quota in veel regio's Ga snel aan de slag in nieuwe regio's zonder eerst quotum aan te vragen.
Flexibele keuze van betalingsmodel voor bestaande ingerichte klanten Klanten met toezeggingen kunnen ten minste tot eind 2024 op het toezeggingsmodel blijven en ervoor kiezen om bestaande toezeggingen te migreren naar uur/reserveringen via een selfservice of beheerd proces.
Ondersteunt de nieuwste modelgeneraties Het model per uur/reservering is vereist voor het implementeren van modellen die na 1 augustus 2024 zijn uitgebracht.

Details van bruikbaarheidsverbetering

De ingerichte quotumgranulariteit verandert van modelspecifiek in modelonafhankelijk. In plaats van elk model en elke versie binnen het abonnement en elke regio met een eigen quotumlimiet, is er één quotumitem per abonnement en regio die het totale aantal PTU's beperkt dat kan worden geïmplementeerd in alle ondersteunde modellen en versies.

Modelonafhankelijk quotum

Vanaf 12 augustus 2024 is het huidige modelspecifieke quotum van bestaande klanten geconverteerd naar modelonafhankelijk. Dit gebeurt automatisch. Er gaat geen quotum verloren tijdens de overgang. Bestaande quotumlimieten worden opgeteld en toegewezen aan een nieuw modelonafhankelijk quotumitem.

Diagram met quotumconsolidatie.

Het nieuwe modelonafhankelijke quotum wordt weergegeven als een quotumitem met de naam Ingerichte beheerde doorvoereenheid, waarbij het model en de versie niet meer zijn opgenomen in de naam. Als u het quotumitem van Azure AI Foundry uitbreidt, worden nog steeds alle implementaties weergegeven die bijdragen aan het quotumitem.

Standaardquotum

Nieuwe en bestaande abonnementen krijgen in veel regio's een klein aantal ingerichte quota toegewezen. Hierdoor kunnen klanten deze regio's gaan gebruiken zonder dat ze eerst quotum hoeven aan te vragen.

Als de regio al een quotumtoewijzing bevat, wordt de quotumlimiet niet gewijzigd voor de regio voor bestaande klanten. Het wordt bijvoorbeeld niet automatisch verhoogd met het nieuwe standaardbedrag.

Selfservicequotumaanvragen

Klanten krijgen geen quotum meer door contact op te leggen met hun verkoopteams. In plaats daarvan gebruiken ze het aanvraagformulier voor selfservicequota en geven ze het door PTU beheerde quotumtype op. Het formulier is toegankelijk via een koppeling naar rechts van het quotumitem. Het doel is om binnen twee werkdagen te reageren op alle quotumaanvragen.

De volgende quotaschermafbeelding toont modelonafhankelijk quotum dat wordt gebruikt door implementaties van verschillende typen en de koppeling voor het aanvragen van extra quota.

Schermopname van de gebruikersinterface van het nieuwe aanvraagtype voor Azure OpenAI die is ingericht voor het aanvragen van meer quotum.

Quotum als limiet

Vóór de update van augustus was Azure OpenAI ingericht alleen beschikbaar voor een paar klanten en werd het quotum toegewezen om de mogelijkheid te maximaliseren om deze te implementeren en te gebruiken. Met deze wijzigingen wordt het proces voor het verkrijgen van quota voor alle gebruikers vereenvoudigd en is er een grotere kans dat er sprake is van servicecapaciteitsbeperkingen wanneer implementaties worden uitgevoerd. Er is een nieuwe API- en portal-ervaring beschikbaar om gebruikers te helpen regio's te vinden waarvoor het abonnement quota heeft en de service capaciteit heeft om implementaties van een gewenst model te ondersteunen.

Het is ook raadzaam dat klanten die toezeggingen gebruiken, nu hun implementaties maken voordat ze toezeggingen maken of uitbreiden om ze te dekken. Dit garandeert dat de capaciteit beschikbaar is voordat u een toezegging maakt en voorkomt dat de toezegging te veel wordt aangeschaft. Ter ondersteuning hiervan is de beperking die verhinderde dat implementaties groter worden gemaakt dan hun toezeggingen, verwijderd. Deze nieuwe benadering voor quotum, beschikbaarheid van capaciteit en toezeggingen komt overeen met wat wordt geboden onder het model voor uur/reservering, en de richtlijnen voor implementatie voordat u een toezegging koopt (of reservering, voor het uurmodel) is hetzelfde voor beide.

Zie de volgende koppelingen voor meer informatie. De richtlijnen voor reserveringen en toezeggingen zijn hetzelfde:

Nieuw betalingsmodel voor reservering per uur

Notitie

De volgende beschrijving van betalingsmodellen is niet van toepassing op de oudere aanbieding 'Ingericht klassiek (PTU-C)'. Ze zijn alleen van invloed op de aanbieding Ingericht (ook wel ingericht beheerd genoemd). Het ingerichte klassieke model blijft onderworpen aan het ongewijzigde betalingsmodel voor maandelijkse toezeggingen.

Microsoft heeft een nieuw betalingsmodel 'Uur/reservering' geïntroduceerd voor ingerichte implementaties. Dit is een aanvulling op het huidige betalingsmodel voor toezeggingen , dat ten minste tot eind 2024 wordt ondersteund.

Betalingsmodel voor toezegging

  • Een regionale, maandelijkse toezegging is vereist voor het gebruik van ingerichte (langere voorwaarden contractueel beschikbaar).

  • Toezeggingen zijn gebonden aan Azure OpenAI-resources, waardoor het verplaatsen van implementaties tussen resources lastig wordt.

  • Toezeggingen kunnen niet worden geannuleerd of gewijzigd tijdens hun looptijd, behalve om nieuwe PTU's toe te voegen.

  • Ondersteunt modellen die zijn uitgebracht vóór 1 augustus 2024.

Betalingsmodel voor reservering per uur

  • Het betalingsmodel is afgestemd op Azure-standaarden voor andere producten.

  • Gebruik per uur wordt ondersteund, zonder toezegging.

  • Kortingen voor één maand en één jaar kunnen worden aangeschaft als regionale Azure-reserveringen.

  • Reserveringen kunnen flexibel worden afgestemd op meerdere abonnementen en het bereik kan op de middellange termijn worden gewijzigd.

  • Ondersteunt alle modellen, zowel oud als nieuw.

Belangrijk

Voor modellen die na 1 augustus 2024 zijn uitgebracht, is het gebruik van het betalingsmodel per uur/reservering vereist. Ze kunnen niet worden geïmplementeerd in Azure OpenAI-resources die actieve toezeggingen hebben. Als u modellen wilt implementeren die na 1 augustus zijn uitgebracht, moeten bestaande klanten het volgende doen:

  • Maak implementaties op Azure OpenAI-resources zonder toezeggingen.
  • Migreer een bestaande resource buiten de toezeggingen.

Framework voor betalingsmodellen

Met de release van het betalingsmodel per uur/gereserveerd zijn betalingsopties flexibeler en is het model rond ingerichte betalingen gewijzigd. Toen de toezeggingen van één maand de enige manier waren om ingericht aan te schaffen, was het model:

  1. Haal een PTU-quotum op van uw Microsoft-accountteam.
  2. Quotum 'Aanschaffen' van een toezegging voor de resource waar u wilt implementeren.
  3. Maak implementaties voor de resource tot aan de limiet van de toezegging.

Het belangrijkste verschil tussen dit model en het nieuwe model is dat voorheen de enige manier om te betalen voor ingerichte was via een korting van één maand. U kunt nu per uur implementaties implementeren en betalen als u kiest en een afzonderlijke beslissing neemt over het feit of u deze wilt korting geven via een toezegging van één maand (zoals voorheen) of een Azure-reservering.

Met dit inzicht is de nieuwe manier om na te denken over betalingsmodellen het volgende:

  1. Haal een PTU-quotum op met behulp van het selfserviceformulier.
  2. Maak implementaties met behulp van uw quotum.
  3. U kunt eventueel een toezegging of reservering aanschaffen of verlengen om een termijnkorting toe te passen op uw implementaties.

Stap 1 en 2 zijn in alle gevallen hetzelfde. Het verschil is of een toezegging of azure-reservering wordt gebruikt als het voertuig om de korting te bieden. In beide modellen:

  • Het is mogelijk om meer PTU's te implementeren dan u korting krijgt. (bijvoorbeeld het maken van een implementatie op korte termijn om een nieuw model uit te proberen, wordt ingeschakeld door te implementeren zonder korting aan te schaffen)

  • De kortingsmethode (toezegging of reservering) past de kortingsprijs toe op een vast aantal PTU's en heeft een bereik dat bepaalt welke implementaties worden meegeteld op basis van de korting.

    Kortingstype Beschikbare bereiken (binnen een regio)
    Toezegging Azure OpenAI-resource
    Rij2 Resourcegroep, één abonnement, beheergroep (groep abonnementen), gedeeld (alle abonnementen in een factureringsrekening)
  • De kortingsprijs wordt toegepast op geïmplementeerde PKU's tot het aantal kortings-PKU's in de korting.

  • Het aantal geïmplementeerde PKU's dat de kortings-PKU's overschrijdt (of niet gedekt door korting) wordt het uurtarief in rekening gebracht.

  • De best practice is om eerst implementaties te maken en vervolgens kortingen toe te passen. Dit is om die service te garanderen. capaciteit is beschikbaar ter ondersteuning van uw implementaties voordat u een termijnverplichting voor PTU's maakt die u niet kunt gebruiken.

Notitie

Wanneer u de aanbevolen procedures volgt, ontvangt u mogelijk uurkosten tussen het moment dat u de implementatie maakt en verhoogt u uw korting (toezegging of reservering).

Daarom raden we u aan uw korting onmiddellijk na de implementatie te verhogen. De vereisten voor het aanschaffen van Azure-reserveringen zijn anders dan voor toezeggingen. U wordt aangeraden deze vóór de implementatie te valideren als u ze wilt gebruiken om uw implementatie te korting te geven. Zie Machtigingen voor het weergeven en beheren van Azure-reserveringen voor meer informatie

Implementaties toewijzen aan kortingsmethode

Klanten die Azure OpenAI gebruiken die vóór augustus 2024 zijn ingericht, kunnen beide of beide betalingsmodellen tegelijk binnen een abonnement gebruiken. Het betalingsmodel dat voor elke implementatie wordt gebruikt, wordt bepaald op basis van de Azure OpenAI-resource:

Resource heeft een actieve toezegging

  • De toezegging kortingen op alle implementaties op de resource tot het aantal PTU's voor de toezegging. Eventuele overtollige PTU's worden per uur gefactureerd.

Resource heeft geen actieve toezegging

  • De implementaties onder de resource komen in aanmerking voor korting op een Azure-reservering. Om deze implementaties te kunnen korting geven, moeten ze binnen het bereik van een actieve reservering bestaan. Alle implementaties binnen het bereik van de reservering (inclusief mogelijk implementaties op andere resources in hetzelfde of andere abonnementen) worden als een groep tot het aantal PTU's op de reservering gereduceerd. Eventuele overtollige PTU's worden per uur gefactureerd.

Wijzigingen in de bestaande betalingsmodus

Klanten die vandaag toezeggingen hebben, kunnen deze ten minste tot eind 2024 blijven gebruiken. Dit omvat het aanschaffen van nieuwe PKU's voor nieuwe of bestaande toezeggingen en het beheren van gedrag voor het verlengen van toezeggingen. De update van augustus heeft echter bepaalde aspecten van de toezeggingsbewerking gewijzigd.

  • Alleen modellen die vóór 1 augustus 2024 of vóór 1 augustus 2024 zijn ingericht, kunnen worden geïmplementeerd op een resource met een toezegging.

  • Als de geïmplementeerde PKU's onder een toezegging de vastgelegde PKU's overschrijden, worden de kosten voor overschrijding per uur verzonden op dezelfde meter per uur als voor het nieuwe betalingsmodel voor uur/reservering. Hierdoor kunnen de overschrijdingskosten worden gereduceerd via een Azure-reservering.

  • Het is mogelijk om meer PTU's te implementeren dan vastgelegd in de resource. Dit biedt ondersteuning voor de mogelijkheid om capaciteitsbeschikbaarheid te garanderen voordat de toezeggingsgrootte wordt verhoogd.

Bestaande resources buiten toezeggingen migreren

Bestaande klanten kunnen ervoor kiezen om hun bestaande resources te migreren van de toezegging naar het betalingsmodel per uur/reservering om te profiteren van de mogelijkheid om de nieuwste modellen te implementeren of om korting voor diverse implementaties onder één reservering samen te voegen.

Er zijn twee benaderingen beschikbaar voor klanten om resources te migreren met behulp van het Commitment-model naar het model Uur/Reservering.

Selfservicemigratie

Met de selfservicemigratiebenadering kan een klant organisch resources van hun toezeggingen afzetten door ze te laten verlopen. Het proces voor het migreren van een resource is als volgt:

  • Stel de bestaande toezegging in om de vervaldatum niet automatisch opnieuw toe te laten en noteer de vervaldatum.

  • Vóór de vervaldatum moet een klant een Azure-reservering aanschaffen voor het totale aantal vastgelegde PKU's per abonnement. Als een bestaande reservering het abonnement al binnen het bereik heeft, kan deze groter worden om de nieuwe PTU's te dekken.

  • Wanneer de toezegging verloopt, schakelen de implementaties onder de resource automatisch over naar de modus Uur/Reservering, waarbij het gebruik door de reservering wordt afgekortingt.

Deze selfservicemigratiebenadering leidt tot een overlapping waarbij de reservering en toezegging beide actief zijn. Dit is een kenmerk van deze migratiemodus en de reserverings- of toezeggingstijd voor deze overlapping wordt niet teruggeschreven naar de klant.

Een alternatieve benadering voor selfservicemigratie is het overschakelen van de reserveringsaankoop na het verstrijken van de toezegging. In deze benadering genereren de implementaties elk uur gebruik voor de periode tussen de vervaldatum van de toezegging en de aankoop van de reservering. Net als bij het vorige model is dit een kenmerk van deze benadering en wordt dit gebruik per uur niet gecrediteerd.

Voordelen van selfservicemigratie:

  • Afzonderlijke resources kunnen op verschillende tijdstippen worden gemigreerd.
  • Klanten beheren de migratie zonder afhankelijkheden van Microsoft.

Nadelen van selfservicemigratie:

  • Er is een korte periode van dubbele facturering of uurkosten tijdens de overschakeling van vastgelegd in facturering per uur/reservering.

Belangrijk

Beide selfservicemethoden genereren enkele extra kosten omdat de betalingsmodus wordt overgeschakeld van Vastgelegd naar Uur/Reservering. Dit zijn kenmerken van de migratiemethoden en klanten worden niet gecrediteerd voor deze kosten. Klanten kunnen ervoor kiezen om de hieronder beschreven beheerde migratiebenadering te gebruiken om ze te voorkomen.

Beheerde migratie

De benadering voor beheerde migratie omvat het samenwerken van klanten met Microsoft om tegelijkertijd alle PTU-toezeggingen in een abonnement/regio bulksgewijs te migreren. Het werkt als volgt:

  1. De klant neemt contact op met het accountteam en vraagt een beheerde migratie aan. Een migratie-eigenaar van het Microsoft-team wordt toegewezen om de klant te helpen bij de migratie.
  2. Er wordt een datum geselecteerd wanneer alle resources binnen elk van de abonnementen en regio's van klanten met de huidige PTU-toezeggingen worden gemigreerd van vastgelegd naar factureringsmodel per uur/reservering. Meerdere abonnementen en regio's kunnen op dezelfde datum worden gemigreerd.
  3. Op de overeengekomen datum:
    • De klant koopt regionale reserveringen om de vastgelegde PKU's te dekken die worden geconverteerd en de reserveringsgegevens door te geven aan de contactpersoon voor Microsoft-migratie.
    • Binnen 2-3 werkdagen worden alle toezeggingen proactief geannuleerd en worden implementaties die eerder onder toezeggingen vallen, het betalingsmodel voor uur/reservering gaan gebruiken.
    • In de factureringsperiode na de factureringsperiode met de reserveringsaankoop ontvangt de klant een tegoed voor de reserveringsaankoop voor de gedeelten van de geannuleerde toezeggingen, te beginnen vanaf het moment van de reserveringsaankoop.

Klanten moeten contact opnemen met hun accountteams om een beheerde migratie te plannen.

Voordelen van beheerde migratie:

  • Bulkmigratie van alle toezeggingen in een abonnement/regio is nuttig voor klanten met veel toezeggingen.
  • Naadloze kostenmigratie: geen mogelijkheid tot dubbele facturering of extra kosten per uur.

Nadelen van beheerde migratie:

  • Alle toezeggingen in een abonnement/regio moeten tegelijkertijd worden gemigreerd.
  • U moet een tijd voor migratie coördineren met het Microsoft-team.

Ingerichte doorvoertoezeggingen beheren

Ingerichte doorvoertoezeggingen worden gemaakt en beheerd door beheercentrum te selecteren in het navigatiemenu quota>> beheren van de Azure AI Foundry-portal.

Schermopname van de gebruikersinterface voor aankoop van toezeggingen met meldingen.

In de weergave Toezeggingen beheren kunt u verschillende dingen doen:

  • Koop nieuwe toezeggingen of bewerk bestaande toezeggingen.
  • Controleer alle toezeggingen in uw abonnement.
  • Identificeer en onderneem actie op toezeggingen die onverwachte facturering kunnen veroorzaken.

In de volgende secties wordt u door deze taken begeleid.

Een ingerichte doorvoeraanzegging aanschaffen

Nu uw toezeggingsplan klaar is, is de volgende stap het maken van de toezeggingen. Toezeggingen worden handmatig gemaakt via Azure AI Foundry en vereisen dat de gebruiker de toezegging maakt om de rol Inzender of Cognitive Services-inzender op abonnementsniveau te hebben.

Voer voor elke nieuwe toezegging die u moet maken de volgende stappen uit:

  1. Start het dialoogvenster Ingerichte doorvoeraankoop door Quota azure>OpenAI Provisioned>Manage Commitment plans te selecteren.

Schermopname van het aankoopdialoogvenster.

  1. Selecteer Aankoopverplichting.

  2. Selecteer de Azure OpenAI-resource en koop de toezegging. U ziet uw resources onderverdeeld in resources met bestaande toezeggingen, die u kunt bewerken en resources die momenteel geen toezegging hebben.

Instelling Opmerkingen
Een resource selecteren Kies de resource waar u de ingerichte implementatie gaat maken. Zodra u de toezegging hebt aangeschaft, kunt u de PTU's niet meer op een andere resource gebruiken totdat de huidige toezegging is verlopen.
Een toezeggingstype selecteren Selecteer Ingericht. (Ingericht is gelijk aan Ingericht beheerd)
Huidig, niet-doorgevoerd ingerichte quotum Het aantal PTU's dat u momenteel kunt doorvoeren naar deze resource.
Bedrag dat moet worden doorgevoerd (PTU) Kies het aantal PTU's dat u wilt doorvoeren. Dit aantal kan worden verhoogd tijdens de toezeggingstermijn, maar kan niet worden verlaagd. Voer waarden in stappen van 50 in voor het toezeggingstype Ingericht.
Toezeggingslaag voor de huidige periode De toezeggingsperiode is ingesteld op één maand.
Verlengingsinstellingen Automatisch opnieuw schalen bij huidige PTU's
Automatisch opnieuw schalen bij lagere PTU's
Automatisch opnieuw schalen
  1. Selecteer Kopen. Er wordt een bevestigingsvenster weergegeven. Nadat u hebt bevestigd, worden uw PPU's doorgevoerd en kunt u deze gebruiken om een ingerichte implementatie te maken. |

Schermopname van de gebruikersinterface van toezeggingsaankoop.

Belangrijk

Voor de hele termijn wordt een nieuwe toezegging in rekening gebracht. Als de verlengingsinstellingen zijn ingesteld op automatisch verlengen, wordt u opnieuw gefactureerd op elke verlengingsdatum op basis van de verlengingsinstellingen.

Een bestaande toezegging voor ingerichte doorvoer bewerken

In de weergave Toezeggingen beheren kunt u ook een bestaande toezegging bewerken. Er zijn twee soorten wijzigingen die u kunt aanbrengen in een bestaande toezegging:

  • U kunt PTU's toevoegen aan de toezegging.
  • U kunt de verlengingsinstellingen wijzigen.

Als u een toezegging wilt bewerken, selecteert u de huidige die u wilt bewerken en selecteert u De toezegging bewerken.

Ingerichte doorvoereenheden toevoegen aan bestaande toezeggingen

Door PTU's toe te voegen aan een bestaande toezegging, kunt u grotere of meer implementaties binnen de resource maken. U kunt dit op elk gewenst moment doen tijdens de looptijd van uw toezegging.

Schermopname van de gebruikersinterface voor aankoop van toezeggingen met een toename van het bedrag aan doorvoerwaarde.

Belangrijk

Wanneer u PTU's toevoegt aan een toezegging, worden ze onmiddellijk gefactureerd op een pro rato bedrag vanaf de huidige datum tot het einde van de bestaande toezeggingstermijn. Als u PTU's toevoegt, wordt de toezeggingstermijn niet opnieuw ingesteld.

Verlengingsinstellingen wijzigen

Instellingen voor het verlengen van toezeggingen kunnen op elk gewenst moment vóór de vervaldatum van uw toezegging worden gewijzigd. Redenen waarom u de verlengingsinstellingen wilt wijzigen, zijn onder andere het beëindigen van het gebruik van ingerichte doorvoer door de toezegging in te stellen om niet automatisch opnieuw te worden verlengd of om het gebruik van ingerichte doorvoer te verlagen door het aantal PTU's te verlagen dat in de volgende periode wordt doorgevoerd.

Belangrijk

Als u een toezegging toestaat om te verlopen of kleiner te maken, zodat de implementaties onder de resource meer PTU's vereisen dan u in uw resource-toezegging hebt, ontvangt u overschrijdingskosten per uur voor eventuele overtollige PTU's. Een resource met implementaties met een totaal van 500 PTU's en een toezegging voor 300 PTU's genereert bijvoorbeeld uuroverschrijdingskosten voor 200 PTU's.

Toezeggingen bewaken en onverwachte facturering voorkomen

Het deelvenster Toezeggingen beheren biedt een overzicht van alle resources met toezeggingen en PTU-gebruik binnen een bepaald Azure-abonnement. Van bijzonder belang zijn:

  • PTU's vastgelegd, geïmplementeerd en gebruik : deze cijfers bieden de grootte van uw toezeggingen en hoeveel wordt gebruikt door implementaties. Maximaliseer uw investering met al uw vastgelegde PKU's.
  • Verloopbeleid en -datum : de vervaldatum en het beleid geven aan wanneer een toezegging verloopt en wat er gebeurt wanneer dit gebeurt. Een toezegging die is ingesteld op automatisch verlengen, genereert een factureringsevenement op de verlengingsdatum. Voor toezeggingen die verlopen, moet u implementaties van deze resources vóór de vervaldatum verwijderen om te voorkomen dat facturering per uur wordt overschredenDe huidige verlengingsinstellingen voor een toezegging.
  • Meldingen : waarschuwingen met betrekking tot belangrijke voorwaarden, zoals ongebruikte toezeggingen en configuraties die kunnen leiden tot factureringsoverschrijdingen. Factureringsoverschrijdingen kunnen worden veroorzaakt door situaties zoals wanneer een toezegging is verlopen en implementaties nog steeds aanwezig zijn, maar zijn overgeschakeld naar facturering per uur.

Veelvoorkomende scenario's voor toezeggingsbeheer

Het gebruik van ingerichte doorvoer stopzetten

Als u het gebruik van ingerichte doorvoer wilt beëindigen en overschrijdingskosten per uur wilt voorkomen na verloop van toezegging, moet u eventuele kosten stoppen nadat de huidige toezeggingen zijn verlopen, twee stappen moeten worden uitgevoerd:

  1. Stel het verlengingsbeleid voor alle toezeggingen in op Niet automatisch opnieuw verlengen.
  2. Verwijder de ingerichte implementaties met behulp van het quotum.

Een toezegging/implementatie verplaatsen naar een nieuwe resource in hetzelfde abonnement/dezelfde regio

Het is niet mogelijk in Azure AI Foundry om een implementatie of een toezegging voor een nieuwe resource rechtstreeks te verplaatsen . In plaats daarvan moet er een nieuwe implementatie worden gemaakt op de doelresource en naar het verkeer worden verplaatst. Er moet een toezegging zijn die is aangeschaft voor de nieuwe resource om dit te bereiken. Omdat toezeggingen vooraf in rekening worden gebracht voor een periode van 30 dagen, is het noodzakelijk om deze verplaatsing te timen met de vervaldatum van de oorspronkelijke toezegging om overlapping met de nieuwe toezegging en dubbele facturering tijdens de overlapping te minimaliseren.

Er zijn twee benaderingen die kunnen worden gebruikt om deze overgang te implementeren.

Optie 1: Overschakeling zonder overlapping

Deze optie vereist enige downtime, maar vereist geen extra quotum en genereert geen extra kosten.

Stappen Opmerkingen
Het verlengingsbeleid voor de bestaande toezegging instellen om te verlopen Dit voorkomt dat de toezegging wordt verlengd en verdere kosten worden gegenereerd
Voordat de bestaande toezegging is verlopen, verwijdert u de implementatie ervan Downtime begint op dit moment en duurt totdat de nieuwe implementatie is gemaakt en verkeer wordt verplaatst. U minimaliseert de duur door de verwijdering zo dicht mogelijk bij de vervaldatum/-tijd te laten plaatsvinden.
Nadat de bestaande toezegging is verlopen, maakt u de toezegging voor de nieuwe resource Minimaliseer downtime door deze en de volgende stap zo snel mogelijk na de vervaldatum uit te voeren.
De implementatie op de nieuwe resource maken en verkeer naar de resource verplaatsen

Optie 2: Overlappende overschakeling

Deze optie heeft geen downtime doordat zowel bestaande als nieuwe implementaties tegelijkertijd live zijn. Hiervoor moet het quotum beschikbaar zijn om de nieuwe implementatie te maken en worden er extra kosten gegenereerd voor de duur van de overlappende implementaties.

Stappen Opmerkingen
Het verlengingsbeleid voor de bestaande toezegging instellen om te verlopen Als u dit doet, voorkomt u dat de toezegging wordt verlengd en verdere kosten worden gegenereerd.
Voordat de bestaande toezegging verloopt:
1. Maak de toezegging voor de nieuwe resource.
2. Maak de nieuwe implementatie.
3. Verkeer wisselen
4. Bestaande implementatie verwijderen
Zorg ervoor dat u voldoende tijd overlaat voor alle stappen voordat de bestaande toezegging verloopt, anders worden overschrijdingskosten gegenereerd (zie volgende sectie) voor opties.

Als de laatste stap langer duurt dan verwacht en eindigt nadat de bestaande toezegging is verlopen, zijn er drie opties om overschrijdingskosten te minimaliseren.

  • Neem downtime: verwijder de oorspronkelijke implementatie en voltooi de verplaatsing.
  • Overschrijding betalen: behoud de oorspronkelijke implementatie en betaal elk uur totdat u verkeer hebt verplaatst en de implementatie hebt verwijderd.
  • Stel de oorspronkelijke toezegging opnieuw in om nog één keer te verlengen. Dit geeft u tijd om de verplaatsing met een bekende kosten te voltooien.

Zowel betalen voor een overschrijding als het opnieuw instellen van de oorspronkelijke toezegging genereren kosten na de oorspronkelijke vervaldatum. Het betalen van overschrijdingskosten is mogelijk goedkoper dan een nieuwe toezegging van één maand als u slechts een dag of twee nodig hebt om de verplaatsing te voltooien. Vergelijk de kosten van beide opties om de laagste kostenbenadering te vinden.

De implementatie verplaatsen naar een nieuwe regio en of abonnement

Dezelfde benaderingen zijn van toepassing bij het verplaatsen van de toezegging en implementatie binnen de regio, behalve dat het beschikbare quotum op de nieuwe locatie in alle gevallen vereist is.

Een bestaande resource weergeven en bewerken

In Azure AI Foundry selecteert u toezeggingen voor beheercentrum>quota>ingericht>beheren en selecteert u een resource met een bestaande toezegging om deze weer te geven of te wijzigen.