AI-arbetsbelastningar i Azure

Artikel
01/08/2025

Den här artikeln beskriver arkitekturutmaningar vid utformning av AI-arbetsbelastningar. Den fokuserar på icke-terministiska funktioner, data- och programdesign och åtgärder. Rekommendationerna baseras på Principer för Azure Well-Architected Framework och innehåller insikter från lyckade Azure-implementeringar.

Dessa artiklar är avsedda för arbetsbelastningsägare och tekniska intressenter som arkitekter, utvecklingsledare och IT-ledare. Specialiserade AI- och dataroller, till exempel dataforskare, bör också vara medvetna om den här vägledningen eftersom samarbete mellan olika roller och team är en viktig aspekt.

Kommentar

Azure erbjuder olika AI-tjänster som du kan integrera i din arbetsbelastning eller bygga runt den. Beroende på dina affärsbehov kan du välja mellan saaS-lösningar (fullständigt hanterad programvara som en tjänst), PaaS-lösningar (plattform som en tjänst) eller skapa en egen AI-lösning. Specifika Azure-tjänster och deras funktioner beskrivs inte här. Vi rekommenderar att du läser respektive produktdokumentation för den informationen.

Vissa AI-arbetsbelastningar finns inte heller i omfånget, till exempel:

Arbetsbelastningar som realiseras via erbjudanden med låg kod och ingen kod, till exempel Copilot Studio.
Arbetsbelastningar som kräver databehandling med höga prestanda.
Arbetsbelastningar som inte implementerar generativa eller diskriminerande AI-användningsfall.

Vad är en AI-arbetsbelastning?

Inom ramen för Well-Architected Framework uppfyller en AI-arbetsbelastning behoven för prediktiva, diskriminerande eller generativa uppgifter. Den fokuserar på etiska funktioner, anpassning till snabbt föränderliga AI-tekniker och förblir relevant och förklarande. Tillämpa Well-Architected Framework-pelarna vid varje beslutspunkt för att säkerställa att systemet är tillförlitligt, säkert, effektivt och kostnadseffektivt.

AI-arbetsbelastningar skiljer sig från traditionella eftersom de ersätter deterministiska funktioner i delar av arbetsbelastningen med icke-terministiskt beteende som löser situationer där fasta resultat är opraktiska. I stället kombinerar de kod och data till en entitet, eller en modell, för att möjliggöra unika upplevelser som traditionella system inte kan tillhandahålla.

Innan du påbörjar dina designstrategier bör du tänka på de här viktiga punkterna först.

Bekanta dig med de breda kategorierna av modeller

Generative AI: Använder maskininlärning för att skapa nytt innehåll autonomt. Den innehåller språkmodeller som kan anpassas med användardata eller användas som tjänster som Azure OpenAI Service. GPT, en typ av språkmodell, specialiserar sig till exempel på att efterlikna mänskligt konversationsspråk och är idealiskt för chatt- och naturspråksupplevelser.

Användningsfall: Generativ AI kan producera artiklar, berättelser och konst. Den kan också generera syntetiska data för att balansera datauppsättningar och göra chattrobotar mer människolika.
Discriminative AI: Använder explicit programmering för att utföra specifika uppgifter baserat på regler och algoritmer. Den är indelad i:
- modellbaserad: Förutsägande system hittar mönster baserat på träning som utförts från tidigare observationer för att göra förutsägelser men kan inte skapa nytt innehåll eller anpassa sig på egen hand.
- Icke-modellbaserad: Autonoma agenter följer fördefinierade regler för att interagera med system, till exempel videospelskaraktärer.
Användningsfall: Discriminative AI används för förutsägelseanalys, rekommendationssystem och bedrägeriidentifiering.

Den här serien med artiklar beskriver olika AI-arbetsbelastningar och fokuserar på specifika typer som språkmodeller när det behövs.

Viktigt!

När du väljer mellan generativa och diskriminerande modeller bör du tänka på den uppgift du behöver utföra. Generativa modeller skapar nya data. Diskriminerande modeller klassificerar befintliga data baserat på funktioner. För klassificerings- eller regressionsaktiviteter väljer du modeller som passar jobbet. Till exempel kan en språkmodell som kan klassificera vara mer mångsidig än en som bara klassificerar.

Utvärdera ditt bygge jämfört med köpalternativ

Om allmänna svar är acceptabla bör en fördefinierad modell eller en AI-tjänstbaserad lösning som använder ogenomskinlig bearbetning vara tillräcklig för din arbetsbelastning. Men om du behöver data som är specifika för ditt företag eller har efterlevnadskrav skapar du en anpassad modell.

När du väljer mellan en anpassad modell, en fördefinierad modell eller en tjänst bör du tänka på följande faktorer:

Data control: Anpassade modeller ger dig mer kontroll över känslig information. Fördefinierade modeller är enklare för allmänna uppgifter.
Anpassning: Anpassade modeller passar bättre för unika behov. Fördefinierade modeller kan sakna flexibilitet.
Kostnad och underhåll: Anpassade modeller behöver löpande underhåll och resurser. Fördefinierade modeller har vanligtvis lägre initiala kostnader och mindre infrastrukturbelastning.
Prestanda: Fördefinierade tjänster erbjuder optimerad infrastruktur och skalbarhet. De är idealiska för behov med låg latens eller hög skalbarhet.
Expertis: Anpassade modeller kräver ett skickligt team. Fördefinierade modeller är ofta snabbare att distribuera och enklare att använda om expertisen är begränsad.

Viktigt!

Att skapa och underhålla en egen modell kräver mycket resurser, tid och expertis. Det är viktigt att undersöka noggrant innan du bestämmer dig. Vanligtvis är det ett bättre alternativ att välja en fördefinierad modell eller en hanterad tjänst.

Vilka är de vanliga utmaningarna?

Beräkningskostnader: AI-funktioner kan vara dyra på grund av höga beräkningsbehov, och beräkningsbehoven kan variera beroende på din arbetsbelastningsdesign. Förstå dina krav och välj rätt tjänst för att hantera kostnader.
säkerhets- och regelefterlevnadskrav: Standardlösningar kanske inte uppfyller dina säkerhets- och regelefterlevnadsbehov. Forskningsalternativ för att undvika onödiga bördor.
Mängd data: Hantering av stora datavolymer i olika format medför utmaningar när det gäller att skydda känslig information och effektiv bearbetning. Att optimera lagrings-, bearbetnings- och överföringskostnader bör vara en pågående aktivitet.
Modell sönderfall: Modeller kan försämras med tiden, vilket leder till felaktiga resultat. Det är svårt att testa AI-system på grund av deras slumpmässighet.
Kompetensutmaningar: Nya AI-arbetsbelastningar kan behöva särskilda roller och nya driftsprocesser som kräver omfattande utbildning.
Ai-innovationens takt: Det kan vara frestande att använda de senaste teknikerna för att hålla sig i framkant. Utvärdera ny teknik noggrant för att säkerställa att de förbättrar användarupplevelsen och inte bara lägger till komplexitet för att vara uppdaterad.
Etiska krav: Avgör tydligt om ditt användningsfall är ett etiskt mål för AI. Det är nödvändigt att upprätthålla etiska standarder under planerings- och implementeringsfaserna för att säkerställa att du skapar ett ansvarsfullt system.

Så här använder du den här vägledningen

✔ Börja med Designmetod, som beskriver de logiska och återkommande temana inom tekniska och operativa områden. Detta systematiska tillvägagångssätt hjälper till att definiera krav och designstrategier. Gå tillbaka till den här metoden när du står inför osäkra val för att hålla dig i linje med arbetsbelastningens övergripande mål. Det ger också ett ramverk för samarbete med intressenter för att motivera tekniska beslut och införliva kundfeedback för kontinuerlig förbättring.

✔ Gå vidare till designprinciper för att se hur designmetoden överensstämmer med grundpelarna i Well-Architected Framework. Överväg tillväxtutveckling. Utvärdera de underliggande principerna för alla pelare tillsammans, inklusive kompromisserna.

✔ Fokusera på de designområden som har störst effekt på din lösning. Varje område innehåller överväganden och rekommendationer som vägleder dig genom designbesluten.

✔ Använd utvärderingsgranskningsverktyget för att utvärdera beredskapen för din optimerade AI-arbetsbelastning i produktion.

Typiska arkitekturmönster och designområden

Följande diagram visar hur data flödar genom systemet från den första samlingen till den slutliga användarinteraktionen.

Arkitekturen belyser integreringen av olika komponenter för att möjliggöra effektiv databehandling, modelloptimering och distribution av realtidsprogram i AI-drivna lösningar. Den innehåller moduler som datakällor, databehandling, modellträning, modelldistribution och användargränssnitt.

I följande tabell beskrivs några viktiga designområden som är relaterade till det mönstret.

Designområden
Programdesign: Lär dig mer om överväganden som är unika för AI-arbetsbelastningar som kan ha en betydande inverkan på dina befintliga standarder för programdesign.
Applikationsplattform: Bestäm de bästa plattformarna som ska användas för att stödja AI-arbetsbelastningar, till exempel modellvärdning, modellträning och inferens.
Utformning av träningsdata: Utforma strategier för datainmatning, förbearbetning, kvarhållning och styrning för att hantera dina träningsdata för modellen.
Grunddatadesign: Utforma strategier för att optimera sökbarhet och hämtning, samtidigt som du uppfyller säkerhets- och efterlevnadskraven för dina grunddata.
Data Platform: Bestäm den bästa värdplattformen för att hantera stora mängder och potentiellt många dataformat som din arbetsbelastning använder.
Maskininlärningsåtgärder och Generativa AI-åtgärder: Upprätta moderna DevOps-metoder för att stödja maskininlärning eller generativa AI-funktioner och -system.
arbetsbelastningsåtgärder: Modernisera dina operativa metoder med nya metoder och lägga till specialiserade roller och utbildning.
Testning och utvärdering: Utveckla test- och utvärderingsstrategier för att mäta egenskaper som noggrannhet, precision, känslighet och specificitet genom mått som är avsedda för AI-arbetsbelastningar.
Arbetsbelastningspersonas: Förstå hur personer är involverade i hela livscykeln för din AI-arbetsbelastning för att säkerställa att ditt team är fullt kapabelt att skapa och stödja den.
Ansvarsfull AI-: Var särskilt uppmärksam på användarupplevelsen och de etiska konsekvenserna av att släppa din AI-lösning till allmänheten. AI ger otroliga möjligheter för nya produkter och tjänster, men det medför också en betydande risk.

Dricks

Varje arkitekturbeslut omfattar en rad överväganden och en uppsättning erkända kompromisser som balanserar olika aspekter av ramverket. Dessa kompromisser anges med den här ikonen .

Gå vidare

Designmetodik

Dela via