Azure Well-Architected Framework perspectief op Azure OpenAI Service

Artikel
08/24/2024

Azure OpenAI Service biedt REST API-toegang tot OpenAI-modellen voor grote talen (LLM's), waarbij Azure-netwerk- en beveiligingsmogelijkheden worden toegevoegd. Dit artikel bevat aanbevelingen voor architectuur om u te helpen weloverwogen beslissingen te nemen wanneer u Azure OpenAI gebruikt als onderdeel van de architectuur van uw workload. De richtlijnen zijn gebaseerd op de pijlers van het Azure Well-Architected Framework.

Belangrijk

Deze handleiding gebruiken

Elke sectie bevat een ontwerpcontrolelijst die architectuurgebieden presenteert, samen met ontwerpstrategieën die zijn gelokaliseerd in het technologiebereik.

Ook zijn inbegrepen aanbevelingen voor de technologiemogelijkheden die kunnen helpen bij het materialiseren van deze strategieën. De aanbevelingen vertegenwoordigen geen volledige lijst met alle configuraties die beschikbaar zijn voor Azure OpenAI en de bijbehorende afhankelijkheden. In plaats daarvan worden de belangrijkste aanbevelingen vermeld die zijn toegewezen aan de ontwerpperspectieven. Gebruik de aanbevelingen om uw proof-of-concept te bouwen of uw bestaande omgevingen te optimaliseren.

Basisarchitectuur die de belangrijkste aanbevelingen demonstreert: end-to-end referentiearchitectuur voor openAI-basischats.

Technologiebereik

Deze beoordeling is uitsluitend gericht op Azure OpenAI.

Betrouwbaarheid

Het doel van de pijler Betrouwbaarheid is om continue functionaliteit te bieden door voldoende tolerantie en de mogelijkheid om snel te herstellen van storingen.

De principes voor betrouwbaarheidsontwerp bieden een ontwerpstrategie op hoog niveau die wordt toegepast op afzonderlijke onderdelen, systeemstromen en het systeem als geheel.

Controlelijst voor ontwerp

Start uw ontwerpstrategie op basis van de controlelijst voor ontwerpbeoordeling voor betrouwbaarheid. Bepaal de relevantie ervan voor uw zakelijke vereisten. Breid de strategie uit om zo nodig meer benaderingen op te nemen.

Tolerantie: kies de juiste implementatieoptie van betalen per gebruik of ingerichte doorvoer op basis van uw use-case. Omdat gereserveerde capaciteit de tolerantie verhoogt, kiest u ingerichte doorvoer voor productieoplossingen. De pay-as-you-go-benadering is ideaal voor ontwikkel-/testomgevingen.
Redundantie: voeg de juiste gateways toe vóór uw Azure OpenAI-implementaties. De gateway moet de mogelijkheid hebben om tijdelijke fouten te weerstaan, zoals beperking en om te routeren naar meerdere Azure OpenAI-exemplaren. Overweeg routering naar exemplaren in verschillende regio's om regionale redundantie te bouwen.
Tolerantie: Als u ingerichte doorvoer gebruikt, kunt u ook een exemplaar van betalen per gebruik implementeren om de overloop te verwerken. U kunt oproepen routeren naar het exemplaar van betalen per gebruik via uw gateway wanneer uw ingerichte doorvoermodel wordt beperkt.
Tolerantie: bewaak het capaciteitsgebruik om ervoor te zorgen dat u de doorvoerlimieten niet overschrijdt. Controleer regelmatig het capaciteitsgebruik om nauwkeurigere voorspellingen te bereiken en om serviceonderbrekingen te voorkomen vanwege capaciteitsbeperkingen.
Tolerantie: volg de richtlijnen voor het afstemmen met grote gegevensbestanden en importeer de gegevens uit een Azure Blob-archief. Grote bestanden, 100 MB of groter, kunnen instabiel worden wanneer ze worden geüpload via formulieren met meerdere onderdelen, omdat de aanvragen atomisch zijn en niet opnieuw kunnen worden geprobeerd of hervat.
Herstel: Definieer een herstelstrategie met een herstelplan voor modellen die zijn afgestemd en voor trainingsgegevens die zijn geüpload naar Azure OpenAI. Omdat Azure OpenAI geen automatische failover heeft, moet u een strategie ontwerpen die de hele service en alle afhankelijkheden omvat, zoals opslag die trainingsgegevens bevat.

Aanbevelingen

Aanbeveling	Voordeel
Frequentielimieten voor betalen per gebruik bewaken: als u de benadering betalen per gebruik gebruikt, beheert u frequentielimieten voor uw modelimplementaties en bewaakt u het gebruik van tokens per minuut (TPM) en aanvragen per minuut (RPM).	Deze belangrijke doorvoerinformatie bevat informatie die nodig is om ervoor te zorgen dat u voldoende TPM toewijst vanuit uw quotum om te voldoen aan de vraag naar uw implementaties. Als u voldoende quotum toewijst, voorkomt u dat aanroepen naar uw geïmplementeerde modellen worden beperkt.
Bewaak het door de inrichting beheerde gebruik voor ingerichte doorvoer: als u het ingerichte betalingsmodel voor doorvoer gebruikt, controleert u het door de inrichting beheerde gebruik.	Het is belangrijk om het door de inrichting beheerde gebruik te bewaken om ervoor te zorgen dat het niet meer dan 100% is, om beperking van aanroepen naar uw geïmplementeerde modellen te voorkomen.
Schakel de functie voor dynamisch quotum in: als uw workloadbudget dit ondersteunt, voert u overprovisioning uit door dynamisch quotum in te schakelen voor modelimplementaties.	Met dynamisch quotum kan uw implementatie meer capaciteit verbruiken dan normaal gesproken, zolang er beschikbare capaciteit is vanuit het perspectief van Azure. Extra quotumcapaciteit kan mogelijk ongewenste beperking voorkomen.
Inhoudsfilters afstemmen: stem inhoudsfilters af om fout-positieven van te agressieve filters te minimaliseren.	Inhoudsfilters blokkeren prompts of voltooiingen op basis van een ondoorzichtige risicoanalyse. Zorg ervoor dat inhoudsfilters zijn afgestemd op het verwachte gebruik voor uw workload.

Beveiliging

Het doel van de beveiligingspijler is het bieden van vertrouwelijkheid, integriteit en beschikbaarheidsgaranties voor de workload.

De principes voor beveiligingsontwerp bieden een ontwerpstrategie op hoog niveau voor het bereiken van deze doelen door benaderingen toe te passen op het technische ontwerp rond Azure OpenAI.

Controlelijst voor ontwerp

Start uw ontwerpstrategie op basis van de controlelijst voor ontwerpbeoordeling voor Beveiliging en identificeer beveiligingsproblemen en besturingselementen om het beveiligingspostuur te verbeteren. Controleer vervolgens de Azure-beveiligingsbasislijn voor Azure OpenAI. Breid ten slotte de strategie uit om zo nodig meer benaderingen op te nemen.

Vertrouwelijkheid beschermen: als u trainingsgegevens uploadt naar Azure OpenAI, gebruikt u door de klant beheerde sleutels voor gegevensversleuteling, implementeert u een strategie voor sleutelrotatie en verwijdert u training, validatie en trainingsresultatengegevens. Als u een extern gegevensarchief gebruikt voor trainingsgegevens, volgt u de aanbevolen beveiligingsprocedures voor dat archief. Gebruik bijvoorbeeld voor Azure Blob Storage door de klant beheerde sleutels voor versleuteling en implementeer een strategie voor sleutelrotatie. Gebruik op beheerde identiteit gebaseerde toegang, implementeer een netwerkperimeter met behulp van privé-eindpunten en schakel toegangslogboeken in.
Vertrouwelijkheid beschermen: bescherm gegevensexfiltratie door de uitgaande URL's te beperken waartoe Azure OpenAI-resources toegang hebben.
Integriteit beveiligen: implementeer toegangsbeheer om gebruikerstoegang tot het systeem te verifiëren en autoriseren met behulp van het principe met minimale bevoegdheden en met behulp van afzonderlijke identiteiten in plaats van sleutels.
Integriteit beschermen: implementeer jailbreakrisicodetectie om uw taalmodelimplementaties te beschermen tegen promptinjectieaanvallen.
Beschikbaarheid beveiligen: gebruik beveiligingscontroles om aanvallen te voorkomen die de quota voor modelgebruik kunnen uitputten. U kunt besturingselementen configureren om de service in een netwerk te isoleren. Als de service toegankelijk moet zijn vanaf internet, kunt u overwegen een gateway te gebruiken om vermoedelijk misbruik te blokkeren door routering of beperking te gebruiken.

Aanbevelingen

Aanbeveling	Voordeel
Veilige sleutels: als voor uw architectuur verificatie op basis van sleutels van Azure OpenAI is vereist, slaat u deze sleutels op in Azure Key Vault, niet in toepassingscode.	Het scheiden van geheimen uit code door ze op te slaan in Key Vault vermindert de kans op het lekken van geheimen. Scheiding vergemakkelijkt ook het centrale beheer van geheimen, waardoor verantwoordelijkheden zoals sleutelrotatie worden versoepeld.
Toegang beperken: openbare toegang tot Azure OpenAI uitschakelen, tenzij uw workload dit vereist. Maak privé-eindpunten als u verbinding maakt van consumenten in een virtueel Azure-netwerk.	Als u de toegang tot Azure OpenAI beheert, voorkomt u aanvallen van onbevoegde gebruikers. Het gebruik van privé-eindpunten zorgt ervoor dat netwerkverkeer privé blijft tussen de toepassing en het platform.
Microsoft Entra-id: Microsoft Entra-id gebruiken voor verificatie en toegang tot Azure OpenAI autoriseren met behulp van op rollen gebaseerd toegangsbeheer (RBAC). Schakel lokale verificatie in Azure AI Services uit en stel deze in op `disableLocalAuth` `true`. Verken identiteiten die voltooiingen of het genereren van installatiekopieën uitvoeren de Gebruikersrol Cognitive Services OpenAI . Ververleent modelautomatiseringspijplijnen en ad-hoc gegevenswetenschap toegang tot een rol zoals Cognitive Services OpenAI-inzender.	Het gebruik van Microsoft Entra ID centraliseert het onderdeel identiteitsbeheer en elimineert het gebruik van API-sleutels. Het gebruik van RBAC met Microsoft Entra ID zorgt ervoor dat gebruikers of groepen precies de machtigingen hebben die ze nodig hebben om hun werk te doen. Dit soort fijnmazige toegangsbeheer is niet mogelijk met Azure OpenAI API-sleutels.
Door de klant beheerde sleutels gebruiken: gebruik door de klant beheerde sleutels voor nauwkeurig afgestemde modellen en trainingsgegevens die worden geüpload naar Azure OpenAI.	Het gebruik van door de klant beheerde sleutels biedt meer flexibiliteit om toegangsbeheer te maken, te draaien, uit te schakelen en in te trekken.
Bescherming tegen jailbreakaanvallen: Gebruik Azure AI Content Safety Studio om jailbreakrisico's te detecteren.	Detecteer jailbreakpogingen om prompts te identificeren en te blokkeren die proberen de veiligheidsmechanismen van uw Azure OpenAI-implementaties te omzeilen.

Kostenoptimalisatie

Kostenoptimalisatie is gericht op het detecteren van uitgavenpatronen, het prioriteren van investeringen in kritieke gebieden en het optimaliseren van anderen om te voldoen aan het budget van de organisatie terwijl aan de bedrijfsvereisten wordt voldaan.

Lees de ontwerpprincipes voor kostenoptimalisatie voor meer informatie over benaderingen voor het bereiken van deze doelen en de compromissen die nodig zijn in technische ontwerpkeuzen met betrekking tot Azure OpenAI.

Controlelijst voor ontwerp

Start uw ontwerpstrategie op basis van de controlelijst voor ontwerpbeoordeling voor Kostenoptimalisatie voor investeringen. Verfijn het ontwerp zodat de workload wordt afgestemd op het toegewezen budget. Uw ontwerp moet gebruikmaken van de juiste Azure-mogelijkheden, investeringen bewaken en mogelijkheden vinden om in de loop van de tijd te optimaliseren.

Kostenbeheer: ontwikkel uw kostenmodel, rekening houdend met promptgrootten. Informatie over promptinvoer- en antwoordgrootten en hoe tekst wordt omgezet in tokens, helpt u bij het maken van een levensvatbaar kostenmodel.
Gebruiksoptimalisatie: begin met prijzen voor betalen per gebruik voor Azure OpenAI totdat uw tokengebruik voorspelbaar is.
Snelheidsoptimalisatie: wanneer uw tokengebruik gedurende een bepaalde periode voldoende hoog en voorspelbaar is, gebruikt u het ingerichte prijsmodel voor doorvoer voor betere kostenoptimalisatie.
Gebruiksoptimalisatie: Overweeg modelprijzen en -mogelijkheden wanneer u modellen kiest. Begin met goedkopere modellen voor minder complexe taken, zoals tekstgeneratie- of voltooiingstaken. Voor complexere taken, zoals taalomzetting of inhoudskennis, kunt u overwegen om geavanceerdere modellen te gebruiken. Overweeg verschillende modelmogelijkheden en maximale gebruikslimieten voor tokens wanneer u een model kiest dat geschikt is voor gebruiksscenario's zoals tekst insluiten, het genereren van afbeeldingen of transcriptiescenario's. Door zorgvuldig het model te selecteren dat het beste bij uw behoeften past, kunt u de kosten optimaliseren terwijl u nog steeds de gewenste toepassingsprestaties bereikt.
Gebruiksoptimalisatie: gebruik de beperkingen voor tokenbeperking die worden aangeboden door de API-aanroepen, zoals max_tokens en n, waarmee wordt aangegeven hoeveel voltooiingen moeten worden gegenereerd.
Gebruiksoptimalisatie: Maximaliseer azure OpenAI-prijsonderbrekingspunten, bijvoorbeeld verfijning en modelonderbrekingspunten, zoals het genereren van afbeeldingen. Omdat er per uur kosten in rekening worden gebracht voor het afstemmen, gebruikt u zoveel tijd als u per uur beschikbaar hebt om de resultaten te verbeteren terwijl u de volgende factureringsperiode vermijdt. Op dezelfde manier zijn de kosten voor het genereren van 100 installatiekopieën gelijk aan de kosten voor 1 installatiekopieën. Maximaliseer prijsonderbrekingspunten in uw voordeel.
Gebruiksoptimalisatie: Verwijder ongebruikte, nauwkeurig afgestemde modellen wanneer ze niet meer worden verbruikt om te voorkomen dat er doorlopende hostingkosten in rekening worden gebracht.
Gebruik aanpassen: promptinvoer en antwoordlengte optimaliseren. Langere prompts verhogen de kosten door meer tokens te verbruiken. Prompts die onvoldoende context missen, helpen de modellen echter niet om goede resultaten te behalen. Maak beknopte prompts die voldoende context bieden voor het model om een nuttig antwoord te genereren. Zorg er ook voor dat u de limiet van de antwoordlengte optimaliseert.
Kostenefficiëntie: Batchaanvragen waar mogelijk om de overhead per oproep te minimaliseren, waardoor de totale kosten kunnen worden verminderd. Zorg ervoor dat u de batchgrootte optimaliseert.
Kostenefficiëntie: Omdat modellen verschillende afstemmingskosten hebben, kunt u deze kosten overwegen als uw oplossing een nauwkeurige afstemming vereist.
Bewaken en optimaliseren: stel een systeem voor kostentracering in waarmee het modelgebruik wordt bewaakt. Gebruik deze informatie om modelkeuzen en promptgrootten te informeren.

Aanbevelingen

Aanbeveling	Voordeel
Ontwerp clientcode om limieten in te stellen: uw aangepaste clients moeten gebruikmaken van de limietfuncties van de Azure OpenAI-voltooiings-API, zoals de maximumlimiet voor het aantal tokens per model (`max_tokens`) of het aantal voltooiingen dat moet worden gegenereerd (`n`). Het instellen van limieten zorgt ervoor dat de server niet meer produceert dan de client nodig heeft.	Door API-functies te gebruiken om het gebruik te beperken, wordt het serviceverbruik afgestemd op de behoeften van de client. Dit bespaart geld door ervoor te zorgen dat het model geen te lang antwoord genereert dat meer tokens verbruikt dan nodig is.
Het gebruik van betalen per gebruik bewaken: als u de benadering betalen per gebruik gebruikt, controleert u het gebruik van TPM en RPM. Gebruik deze informatie om beslissingen over architectuurontwerpen te informeren, zoals welke modellen moeten worden gebruikt en om promptgrootten te optimaliseren.	Door TPM en RPM continu te bewaken, beschikt u over relevante metrische gegevens om de kosten van Azure OpenAI-modellen te optimaliseren. U kunt deze bewaking koppelen aan modelfuncties en modelprijzen om het modelgebruik te optimaliseren. U kunt deze bewaking ook gebruiken om promptgrootten te optimaliseren.
Het gebruik van ingerichte doorvoer bewaken: als u ingerichte doorvoer gebruikt, controleert u het door de inrichting beheerde gebruik om ervoor te zorgen dat u niet de ingerichte doorvoer gebruikt die u hebt aangeschaft.	Continu het bewaken van het door de inrichting beheerde gebruik geeft u de informatie die u moet begrijpen als u de ingerichte doorvoer onderbenut.
Kostenbeheer: gebruik functies voor kostenbeheer met OpenAI om kosten te bewaken, budgetten in te stellen om kosten te beheren en waarschuwingen te maken om belanghebbenden op de hoogte te stellen van risico's of afwijkingen.	Kostenbewaking, budgetten instellen en waarschuwingen instellen, biedt governance met de juiste verantwoordelijkheidsprocessen.

Operationele topprestaties

Operational Excellence richt zich voornamelijk op procedures voor ontwikkelprocedures, waarneembaarheid en releasebeheer.

De ontwerpprincipes van Operational Excellence bieden een ontwerpstrategie op hoog niveau voor het bereiken van deze doelstellingen voor de operationele vereisten van de workload.

Controlelijst voor ontwerp

Start uw ontwerpstrategie op basis van de controlelijst voor ontwerpbeoordeling voor Operational Excellence. Deze controlelijst definieert processen voor waarneembaarheid, testen en implementatie met betrekking tot Azure OpenAI.

Azure DevOps-cultuur: zorg voor implementatie van Azure OpenAI-exemplaren in uw verschillende omgevingen, zoals ontwikkeling, test en productie. Zorg ervoor dat u omgevingen hebt ter ondersteuning van doorlopend leren en experimenteren gedurende de hele ontwikkelingscyclus.
Waarneembaarheid: de juiste metrische gegevens bewaken, aggregeren en visualiseren.
Waarneembaarheid: als diagnostische gegevens van Azure OpenAI onvoldoende zijn voor uw behoeften, kunt u overwegen om een gateway zoals Azure API Management te gebruiken voor Azure OpenAI om binnenkomende prompts en uitgaande antwoorden te registreren, indien toegestaan. Deze informatie kan u helpen inzicht te hebben in de effectiviteit van het model voor binnenkomende prompts.
Implementeren met vertrouwen: Gebruik infrastructuur als code (IaC) om Azure OpenAI, modelimplementaties en andere infrastructuur te implementeren die vereist is voor het verfijnen van modellen.
Implementeren met vertrouwen: volg de procedures voor grote taalmodelbewerkingen (LLMOps) om het beheer van uw Azure OpenAI-LLMM's operationeel te maken, waaronder implementatie, afstemming en prompt-engineering.
Automatiseren voor efficiëntie: als u verificatie op basis van sleutels gebruikt, implementeert u een geautomatiseerde strategie voor sleutelrotatie.

Aanbevelingen

Aanbeveling	Voordeel
Azure Diagnostics inschakelen en configureren: Diagnostische gegevens inschakelen en configureren voor de Azure OpenAI-service.	Met diagnostische gegevens worden metrische gegevens en logboeken verzameld en geanalyseerd, zodat u de beschikbaarheid, prestaties en werking van Azure OpenAI kunt bewaken.

Prestatie-efficiëntie

Prestatie-efficiëntie gaat over het onderhouden van de gebruikerservaring, zelfs wanneer er een toename van de belasting is door capaciteit te beheren. De strategie omvat het schalen van resources, het identificeren en optimaliseren van potentiële knelpunten en het optimaliseren van piekprestaties.

De ontwerpprincipes prestatie-efficiëntie bieden een ontwerpstrategie op hoog niveau voor het bereiken van deze capaciteitsdoelen ten opzichte van het verwachte gebruik.

Controlelijst voor ontwerp

Start uw ontwerpstrategie op basis van de controlelijst voor ontwerpbeoordeling voor prestatie-efficiëntie voor het definiëren van een basislijn op basis van key performance indicators voor Azure OpenAI-workloads.

Capaciteit: schatting maken van de elasticiteitsvereisten van consumenten. Identificeer verkeer met hoge prioriteit dat synchrone reacties en verkeer met lage prioriteit vereist dat asynchroon en batchgewijs kan worden uitgevoerd.
Capaciteit: Benchmark-tokenverbruiksvereisten op basis van geschatte eisen van consumenten. Overweeg het hulpprogramma azure OpenAI-benchmarking te gebruiken om u te helpen bij het valideren van de doorvoer als u ingerichte doorvoereenheden (PTU)-implementaties gebruikt.
Capaciteit: Gebruik ingerichte doorvoer voor productieworkloads. Ingerichte doorvoer biedt toegewezen geheugen en rekencapaciteit, gereserveerde capaciteit en consistente maximale latentie voor de opgegeven modelversie. De aanbieding voor betalen per gebruik kan leiden tot problemen met luidruchtige buren , zoals verhoogde latentie en beperking in regio's die zwaar worden gebruikt. Bovendien biedt de benadering betalen per gebruik geen gegarandeerde capaciteit.
Capaciteit: voeg de juiste gateways toe vóór uw Azure OpenAI-implementaties. Zorg ervoor dat de gateway kan worden gerouteerd naar meerdere exemplaren in dezelfde of verschillende regio's.
Capaciteit: wijs PTU's toe om uw voorspelde gebruik te dekken en vul deze PTU's aan met een TPM-implementatie om elasticiteit boven die limiet te verwerken. Deze benadering combineert basisdoorvoer met elastische doorvoer voor efficiëntie. Net als bij andere overwegingen vereist deze benadering een aangepaste gatewayimplementatie om aanvragen naar de TPM-implementatie te routeren wanneer de PTU-limieten worden bereikt.
Capaciteit: verzend aanvragen met hoge prioriteit synchroon. Wachtrij aanvragen met lage prioriteit en verzend ze in batches wanneer de vraag laag is.
Capaciteit: Selecteer een model dat overeenkomt met uw prestatievereisten, rekening houdend met de afweging tussen snelheid en uitvoercomplexiteit. Modelprestaties kunnen aanzienlijk variëren op basis van het gekozen modeltype. Modellen die zijn ontworpen voor snelheid bieden snellere reactietijden, wat nuttig kan zijn voor toepassingen die snelle interacties vereisen. Omgekeerd kunnen geavanceerdere modellen uitvoer van hogere kwaliteit leveren ten koste van een verhoogde reactietijd.
Prestaties bereiken: Voor toepassingen zoals chatbots of gespreksinterfaces kunt u overwegen streaming te implementeren. Streaming kan de waargenomen prestaties van Azure OpenAI-toepassingen verbeteren door reacties op gebruikers op een incrementele manier te leveren, waardoor de gebruikerservaring wordt verbeterd.
Prestaties bereiken: bepaal wanneer u fine-tuning wilt gebruiken voordat u zich doorvoert voor het afstemmen. Hoewel er goede gebruiksscenario's zijn voor het afstemmen, zoals wanneer de informatie die nodig is om het model te sturen te lang of complex is om in de prompt te passen, moet u ervoor zorgen dat prompt engineering- en ophaal-augmented generation-benaderingen (RAG) niet werken of demonstrabel duurder zijn.
Prestaties bereiken: Overweeg het gebruik van toegewezen modelimplementaties per consumentengroep om isolatie per modelgebruik te bieden die kan helpen bij het voorkomen van lawaaierige buren tussen uw consumentengroepen.

Aanbevelingen

Er zijn geen aanbevolen configuraties voor prestatie-efficiëntie voor Azure OpenAI.

Azure Policy

Azure biedt een uitgebreide set ingebouwde beleidsregels met betrekking tot Azure OpenAI en de bijbehorende afhankelijkheden. Enkele van de voorgaande aanbevelingen kunnen worden gecontroleerd via Azure Policy. Houd rekening met de volgende beleidsdefinities:

Deze Azure Policy-definities zijn ook best practice-aanbevelingen voor Azure Advisor-beveiliging voor Azure OpenAI.

Volgende stappen

Bekijk de volgende artikelen als resources die de aanbevelingen laten zien die in dit artikel zijn gemarkeerd.

Gebruik deze referentiearchitectuur als voorbeeld van hoe u de richtlijnen van dit artikel kunt toepassen op een workload: end-to-end-chatarchitectuur basislijn openAI.
Bouw expertise op het gebied van implementatie met behulp van de productdocumentatie van Azure Machine Learning .

Delen via

Azure Well-Architected Framework perspectief op Azure OpenAI Service

Technologiebereik

Betrouwbaarheid

Controlelijst voor ontwerp

Aanbevelingen

Beveiliging

Controlelijst voor ontwerp

Aanbevelingen

Kostenoptimalisatie

Controlelijst voor ontwerp

Aanbevelingen

Operationele topprestaties

Controlelijst voor ontwerp

Aanbevelingen

Prestatie-efficiëntie

Controlelijst voor ontwerp

Aanbevelingen

Azure Policy

Volgende stappen

Feedback

Aanvullende resources