Azure OpenAI-service en -functies in Azure Government
In dit artikel worden de verschillen beschreven bij het gebruik van Azure OpenAI in Azure Government in vergelijking met het commerciële cloudaanbod. Als dit niet is opgegeven, wordt ervan uitgegaan dat het Azure OpenAI-model of de functie niet beschikbaar is in de Azure Government-omgeving. Meer informatie over de Azure OpenAI-service zelf vindt u in azure OpenAI Service-documentatie.
Azure OpenAI-modellen
Meer informatie over de verschillende mogelijkheden van elk model in Azure OpenAI Service-modellen. Houd voor klanten met BCDR-overwegingen (Business Continuity and Disaster Recovery) zorgvuldig rekening met de implementatietypen, regio's en de beschikbaarheid van modellen, omdat niet alle combinaties van modellen/typen beschikbaar zijn in beide regio's.
In de volgende secties ziet u de beschikbaarheid van modellen per regio en implementatietype. Modellen en versies die niet worden vermeld, zijn momenteel niet beschikbaar in Azure Government.
Beschikbaarheid van standaardimplementatiemodel
Regio | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4, 1106-Preview | gpt-35-turbo, 0125 | gpt-35-turbo, 1106 | tekst-insluiten-3-groot, 1 | text-embedding-ada-002, 2 |
---|---|---|---|---|---|---|---|
usgovarizona | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ |
usgovvirginia | ✅ | - | ✅ | ✅ | ✅ | - | ✅ |
Als u quotumverhogingen voor deze modellen wilt aanvragen, dient u een aanvraag in bij https://aka.ms/AOAIGovQuota. Let op de volgende maximale quotumlimieten die via dat formulier zijn toegestaan:
gpt-4o | gpt-4o-mini | gpt-4 | gpt-35-turbo | tekst-insluiten-3-groot | tekst-insluiten-ada-002 |
---|---|---|---|---|---|
300.000 | 600.000 | 200.000 | 500.000 | 700.000 | 700.000 |
Beschikbaarheid van ingerichte implementatiemodellen
Regio | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4, 1106-Preview | gpt-35-turbo, 0125 | gpt-35-turbo, 1106 |
---|---|---|---|---|---|
usgovarizona | ✅ | - | - | ✅ | - |
usgovvirginia | ✅ | - | - | ✅ | - |
[OPMERKING]
Ingerichte doorvoereenheden (PTU's) verschillen van het standaardquotum in Azure OpenAI en zijn niet standaard beschikbaar in Azure Government. Neem contact op met uw Microsoft-accountteam voor meer informatie over deze aanbieding.
Azure OpenAI-functies
De volgende functieverschillen bestaan bij het vergelijken van Azure OpenAI in Azure Government versus commerciële cloud.
Functie | Beschrijving |
---|---|
Gestructureerde uitvoer | Momenteel niet ondersteund. |
Aankopen op basis van reserveringen | Momenteel niet ondersteund. |
Batch-implementaties | Momenteel niet ondersteund. |
Uw gegevens verbinden | Virtueel netwerk en privékoppelingen worden ondersteund. Implementatie naar een web-app of een copilot in Copilot Studio wordt niet ondersteund. |
Misbruikbewaking | Niet alle functies van Misbruikcontrole zijn ingeschakeld voor Azure OpenAI in Azure Government. U bent verantwoordelijk voor het implementeren van redelijke technische en operationele maatregelen om het gebruik van de service te detecteren en te beperken in strijd met de productvoorwaarden. Automatische inhoudsclassificatie en -filtering blijven standaard ingeschakeld voor Azure Government. Als gewijzigde inhoudsfilters vereist zijn, moet u op https://aka.ms/AOAIGovModifyContentFilter |
Gegevensopslag | In Azure Government zijn er momenteel geen Azure OpenAI-functies ingeschakeld waarmee klantgegevens at rest worden opgeslagen. Cmk (Customer Managed Keys) kan echter nog steeds worden ingeschakeld in Azure Government om het gebruik van hetzelfde beleid in Azure Government als in de openbare cloud te ondersteunen. Houd er ook rekening mee dat als Azure OpenAI-functies voor het opslaan van klantgegevens in de toekomst zijn ingeschakeld in Azure Government, elke bestaande CMK-implementatie op die gegevens op dat moment wordt toegepast. Meer informatie vindt u in Azure OpenAI Data Privacy. |
Naleving | Bekijk de huidige status van Azure OpenAI-naleving in Azure Government bij het auditbereik van Azure Government Services |
Service-eindpunten | openai.azure.us |
Sleutelportals |
|
Ingerichte implementaties in Azure Government
De volgende handleiding helpt u bij het instellen van een ingerichte implementatie met uw Azure OpenAI Service-resource in Azure Government.
Vereisten
- Een Azure Government-abonnement
- Een Azure OpenAI-resource
- Een goedgekeurd quotum voor een ingerichte implementatie en een toezegging aangeschaft
Ingerichte doorvoertoezeggingen beheren
Voor Azure OpenAI in Azure Government vereisen ingerichte doorvoerimplementaties vooraf gemaakte en beheerde toezeggingen vanuit de weergave Toezeggingen beheren in Azure OpenAI Studio. U kunt naar deze weergave navigeren door Toezeggingen beheren te selecteren in het deelvenster Quota.
In de weergave Toezeggingen beheren kunt u verschillende dingen doen:
- Koop nieuwe toezeggingen of bewerk bestaande toezeggingen.
- Controleer alle toezeggingen in uw abonnement.
- Identificeer en onderneem actie op toezeggingen die onverwachte facturering kunnen veroorzaken.
Instelling | Opmerkingen |
---|---|
Een resource selecteren | Kies de resource waarin u de ingerichte implementatie maakt. Nadat u de toezegging hebt aangeschaft, kunt u het quotum voor een andere resource pas gebruiken als de huidige toezegging is verlopen. |
Een toezeggingstype selecteren | Selecteer Ingericht. (Ingericht is gelijk aan Ingericht beheerd) |
Huidig, niet-doorgevoerd ingerichte quotum | Het aantal PTU's dat u momenteel kunt doorvoeren naar deze resource. |
Bedrag dat moet worden doorgevoerd (PTU) | Kies het aantal PTU's dat u wilt doorvoeren. Dit aantal kan worden verhoogd tijdens de toezeggingstermijn, maar kan niet worden verlaagd. Voer waarden in stappen van 50 in voor het toezeggingstype Ingericht. |
Toezeggingslaag voor de huidige periode | De toezeggingsperiode is ingesteld op één maand. |
Verlengingsinstellingen | Automatisch opnieuw schalen bij huidige PTU's Automatisch opnieuw schalen bij lagere PTU's Niet automatisch opnieuw schalen |
Belangrijk
Voor de hele termijn wordt een nieuwe toezegging in rekening gebracht. Als de verlengingsinstellingen zijn ingesteld op automatisch verlengen, wordt u opnieuw gefactureerd op elke verlengingsdatum op basis van de verlengingsinstellingen.
Belangrijk
Wanneer u PTU's toevoegt aan een toezegging, worden ze onmiddellijk gefactureerd op een pro rato bedrag vanaf de huidige datum tot het einde van de bestaande toezeggingstermijn. Als u PTU's toevoegt, wordt de toezeggingstermijn niet opnieuw ingesteld.
Verlengingsinstellingen wijzigen
Instellingen voor het verlengen van toezeggingen kunnen op elk gewenst moment vóór de vervaldatum van uw toezegging worden gewijzigd.
Belangrijk
Als u een toezegging toestaat om te verlopen of kleiner te maken, zodat de implementaties onder de resource meer PTU's vereisen dan u in uw resource-toezegging hebt, ontvangt u overschrijdingskosten per uur voor eventuele overtollige PTU's. Een resource met implementaties met een totaal van 500 PTU's en een toezegging voor 300 PTU's genereert bijvoorbeeld uuroverschrijdingskosten voor 200 PTU's.
Veelvoorkomende scenario's voor toezeggingsbeheer
Het gebruik van ingerichte doorvoer stopzetten
Als u het gebruik van ingerichte doorvoer wilt beëindigen en kosten voor overschrijding per uur wilt voorkomen na het verlopen van de toezegging, moet u twee stappen uitvoeren:
- Stel het verlengingsbeleid voor alle toezeggingen in op Niet automatisch opnieuw verlengen.
- Verwijder de ingerichte implementaties met behulp van het quotum.
Een toezegging/implementatie verplaatsen naar een nieuwe resource in hetzelfde abonnement/dezelfde regio
Het is niet mogelijk in Azure OpenAI Studio om een implementatie of een toezegging voor een nieuwe resource rechtstreeks te verplaatsen . In plaats daarvan moet er een nieuwe implementatie worden gemaakt op de doelresource en naar het verkeer worden verplaatst. Voor dit proces is een nieuwe toezeggingsaankoop vereist voor de nieuwe resource. Omdat toezeggingen vooraf in rekening worden gebracht voor een periode van 30 dagen, is het noodzakelijk om deze verplaatsing te timen met de vervaldatum van de oorspronkelijke toezegging om overlapping met de nieuwe toezegging en dubbele facturering tijdens de overlapping te minimaliseren.
Er zijn twee benaderingen die kunnen worden gebruikt om deze overgang te implementeren.
Optie 1: Overschakeling zonder overlapping
Deze optie vereist enige downtime, maar vereist geen extra quotum en genereert geen extra kosten.
Stappen | Opmerkingen |
---|---|
Het verlengingsbeleid voor de bestaande toezegging instellen om te verlopen | Met deze actie wordt voorkomen dat de toezegging wordt verlengd en verdere kosten worden gegenereerd |
Voordat de bestaande toezegging is verlopen, verwijdert u de implementatie ervan | Downtime begint op dit moment en duurt totdat de nieuwe implementatie is gemaakt en verkeer wordt verplaatst. U kunt de duur minimaliseren door de verwijdering zo dicht mogelijk bij de vervaldatum/-tijd te laten plaatsvinden. |
Nadat de bestaande toezegging is verlopen, maakt u de toezegging voor de nieuwe resource | Minimaliseer downtime door deze stap en de volgende stap zo snel mogelijk na de vervaldatum uit te voeren. |
De implementatie op de nieuwe resource maken en verkeer naar de resource verplaatsen |
Optie 2: Overlappende overschakeling
Deze optie heeft geen downtime doordat zowel bestaande als nieuwe implementaties tegelijkertijd live zijn. Deze methode vereist ook een quotum dat beschikbaar is om de nieuwe implementatie te maken en extra kosten genereert tijdens de overlappende implementaties.
Stappen | Opmerkingen |
---|---|
Het verlengingsbeleid voor de bestaande toezegging instellen om te verlopen | Als u dit doet, voorkomt u dat de toezegging wordt verlengd en verdere kosten worden gegenereerd. |
Voordat de bestaande toezegging verloopt: 1. Maak de toezegging voor de nieuwe resource. 2. Maak de nieuwe implementatie. 3. Verkeer wisselen 4. Bestaande implementatie verwijderen |
Zorg ervoor dat u voldoende tijd overlaat voor alle stappen voordat de bestaande toezegging verloopt, anders worden overschrijdingskosten gegenereerd (zie volgende sectie) voor opties. |