AI-arbetsbelastningar i Azure
Den här vägledningen beskriver arkitekturutmaningar vid utformning av AI-arbetsbelastningar, med fokus på icke-deterministiska funktioner, data- och programdesign och åtgärder. Rekommendationerna baseras på principerna för Azure Well-Architected Framework (WAF) och innehåller insikter från lyckade Azure-implementeringar.
Dessa artiklar är avsedda för arbetsbelastningsägare och tekniska intressenter som arkitekter, utvecklingsledare och IT-ledare. Specialiserade AI- och dataroller, till exempel dataforskare, bör också vara medvetna om den här vägledningen eftersom samarbete mellan olika roller och team är en viktig aspekt.
Kommentar
Microsoft Azure erbjuder en mängd olika AI-tjänster som kan integreras i din arbetsbelastning eller byggas runt den. Beroende på dina affärsbehov kan du välja mellan fullständigt hanterade SaaS-lösningar, PaaS-lösningar eller att skapa en egen AI-lösning. Specifika Azure-tjänster och deras funktioner beskrivs inte här. För dessa rekommenderar vi att du refererar till respektive produktdokumentation.
Vissa AI-arbetsbelastningar finns inte heller i omfånget, till exempel:
- Arbetsbelastningar som realiseras via erbjudanden med låg kod och ingen kod, till exempel Microsoft Copilot Studio.
- Arbetsbelastningar som kräver databehandling med höga prestanda.
- Arbetsbelastningar som inte implementerar generativa eller diskriminerande AI-användningsfall.
Vad är en AI-arbetsbelastning?
När det gäller WAF uppfyller en AI-arbetsbelastning behoven för prediktiva, diskriminerande eller generativa uppgifter. Den fokuserar på etiska funktioner, anpassning till snabbt föränderliga AI-tekniker och förblir relevant och förklarande. WAF-pelarna bör tillämpas vid varje beslutspunkt för att säkerställa att systemet är tillförlitligt, säkert, effektivt och kostnadseffektivt.
AI-arbetsbelastningar skiljer sig från traditionella eftersom de ersätter deterministiska funktioner i delar av arbetsbelastningen med icke-deterministiskt beteende som löser situationer där fasta resultat är opraktiska. I stället kombinerar de kod och data till en entitet, eller en modell, vilket möjliggör unika upplevelser som traditionella system inte kan tillhandahålla.
Innan du påbörjar dina designstrategier bör du tänka på de här viktiga punkterna först.
Bekanta dig med de breda kategorierna av modeller
Generativ AI använder maskininlärning för att autonomt skapa nytt innehåll. Den innehåller språkmodeller som kan anpassas med användardata eller användas som tjänster som Azure OpenAI. GPT, en typ av språkmodell, specialiserar sig till exempel på att efterlikna mänskligt konversationsspråk och är idealiskt för chatt- och naturspråksupplevelser.
Användningsfall: Generativ AI kan producera artiklar, berättelser, konst, generera syntetiska data för att balansera datamängder och göra chattrobotar mer människoliknande.
Discriminative AI använder explicit programmering för att utföra specifika uppgifter baserat på regler och algoritmer. Den kan delas in i:
Modellbaserad. Förutsägande system som hittar mönster, baserat på träning som utförts från tidigare observationer, för att göra förutsägelser men inte kan skapa nytt innehåll eller anpassa sig på egen hand.
Icke-modellbaserad. Autonoma agenter som följer fördefinierade regler för att interagera med system, till exempel tv-spelskaraktärer.
Användningsfall: Discriminative AI används för förutsägelseanalys, rekommendationssystem och bedrägeriidentifiering.
Den här serien med artiklar beskriver olika AI-arbetsbelastningar, med fokus på specifika typer som språkmodeller när det behövs.
Viktigt!
När du väljer mellan generativa och diskriminerande modeller bör du tänka på den uppgift du behöver utföra. Generativa modeller skapar nya data, medan diskriminerande modeller klassificerar befintliga data baserat på funktioner. För klassificerings- eller regressionsaktiviteter väljer du modeller som passar jobbet. Till exempel kan en språkmodell som kan klassificera vara mer mångsidig än en som bara klassificerar.
Utvärdera ditt bygge jämfört med köpalternativ
Om allmänna svar är acceptabla bör en fördefinierad modell eller en AI-tjänstbaserad lösning som använder ogenomskinlig bearbetning vara tillräcklig för din arbetsbelastning. Men om du behöver data som är specifika för ditt företag eller har efterlevnadskrav måste du skapa en anpassad modell.
När du väljer mellan en anpassad modell, en fördefinierad modell eller en tjänst bör du tänka på följande faktorer:
Datakontroll. Anpassade modeller ger dig mer kontroll över känsliga data. Fördefinierade modeller är enklare för allmänna uppgifter.
Anpassning. Anpassade modeller passar bättre för unika behov. Fördefinierade modeller kan sakna flexibilitet.
Kostnad och underhåll. Anpassade modeller behöver löpande underhåll och resurser. Fördefinierade modeller har vanligtvis lägre initiala kostnader och mindre infrastrukturbelastning.
Prestanda. Fördefinierade tjänster erbjuder optimerad infrastruktur och skalbarhet. De är idealiska för behov med låg latens eller hög skalbarhet.
Expertis. Anpassade modeller kräver ett skickligt team. Fördefinierade modeller kan vara snabbare att distribuera och enklare att använda om expertisen är begränsad.
Viktigt!
Att skapa och underhålla en egen modell kräver mycket resurser, tid och expertis. Det är viktigt att undersöka noggrant innan du bestämmer dig. Vanligtvis är det ett bättre alternativ att välja en fördefinierad modell eller en hanterad tjänst.
Vilka är de vanliga utmaningarna?
Beräkningskostnader. AI-funktioner kan vara dyra på grund av höga beräkningsbehov och beräkningsbehoven kan variera beroende på din arbetsbelastningsdesign. Förstå dina krav och välj rätt tjänst för att hantera kostnader.
Säkerhet och efterlevnadskrav. Färdiga lösningar kanske inte uppfyller dina säkerhets- och efterlevnadsbehov. Forskningsalternativ för att undvika onödiga bördor.
Datavolym. Hantering av stora datavolymer i olika format medför utmaningar när det gäller att skydda känslig information och effektiv bearbetning. Optimera lagrings-, bearbetnings- och överföringskostnader bör vara en pågående aktivitet.
Modellförfall. Modeller kan försämras med tiden, vilket leder till felaktiga resultat. Det är svårt att testa AI-system på grund av deras slumpmässighet.
Kompetensutmaningar. Nya AI-arbetsbelastningar kan behöva specialiserade roller och nya driftsprocesser som kräver omfattande utbildning.
Ai-innovationens takt. Att införa de senaste teknikerna kan vara frestande att hålla sig i framkant. Utvärdera ny teknik noggrant för att säkerställa att de förbättrar användarupplevelsen och inte bara lägger till komplexitet för att vara uppdaterad.
Etiska krav. Du måste tydligt avgöra om ditt användningsfall är ett etiskt mål för AI. Det är nödvändigt att upprätthålla etiska standarder under planerings- och implementeringsfaserna för att säkerställa att du skapar ett ansvarsfullt system.
Hur använder jag den här vägledningen?
✔ Börja med designmetodik, som beskriver de logiska och återkommande temana inom tekniska och operativa områden. Den här systematiska metoden hjälper dig att definiera krav och designstrategier. Gå tillbaka till den här metoden när du har osäkra val för att hålla dig i linje med arbetsbelastningens övergripande mål. Det ger också ett ramverk för samarbete med intressenter för att motivera tekniska beslut och införliva kundfeedback för kontinuerlig förbättring.
✔ Gå vidare till Designprinciper för att se hur designmetoden överensstämmer med grundpelarna i det välarkitekterade ramverket, med tanke på tillväxtutvecklingen. Utvärdera de underliggande principerna för alla pelare tillsammans, inklusive kompromisserna.
✔ Fokusera på de designområden som har störst effekt på din lösning. Varje område innehåller överväganden och rekommendationer som vägleder dig genom designbesluten.
✔ Använd utvärderingsgranskningsverktyget för att utvärdera beredskapen för din optimerade AI-arbetsbelastning i produktion.
Typiska arkitekturmönster och designområden
Arkitekturen belyser integreringen av olika komponenter för att möjliggöra effektiv databehandling, modelloptimering och distribution av realtidsprogram i AI-drivna lösningar. Den innehåller olika moduler som datakällor, databehandling, modellträning, modelldistribution och användargränssnitt, som illustrerar hur data flödar genom systemet från inledande samling till slutlig användarinteraktion.
I följande tabell beskrivs några viktiga designområden som är relaterade till det mönstret.
Designområden |
---|
Programdesign. Lär dig mer om överväganden som är unika för AI-arbetsbelastningar som kan ha en betydande inverkan på dina befintliga programdesignstandarder. |
Programplattform. Fastställ de bästa plattformarna som ska användas för att stödja AI-arbetsbelastningsfunktioner som modellvärd, modellträning och slutsatsdragning. |
Träna datadesign. Utforma strategier för datainmatning, förbearbetning, kvarhållning och styrning för att hantera dina modellträningsdata. |
Grunddatadesign. Utforma strategier för att optimera sökbarhet och hämtning, samtidigt som du uppfyller säkerhets- och efterlevnadskraven för dina grunddata. |
Dataplattform. Fastställ den bästa värdplattformen för att hantera de stora mängder och potentiellt många dataformat som din arbetsbelastning använder. |
Maskininlärningsåtgärder och Generativa AI-åtgärder. Etablera moderna DevOps-metoder för att stödja dina funktioner och system för maskininlärning eller generativ AI. |
Arbetsbelastningsåtgärder. Modernisera dina operativa metoder med nya metoder och lägga till specialiserade roller och utbildning. |
Testning och utvärdering. Utveckla test- och utvärderingsstrategier för att mäta egenskaper som noggrannhet, precision, känslighet och specificitet genom mått som specifikt har riktats mot AI-arbetsbelastningar. |
Arbetsbelastningspersonas. Förstå hur personas är involverade i hela livscykeln för din AI-arbetsbelastning för att säkerställa att ditt team är fullt kapabelt att skapa och stödja det. |
Ansvarsfull AI. AI ger otroliga möjligheter för nya produkter och tjänster, men det medför också en betydande risk. Var särskilt uppmärksam på användarupplevelsen och de etiska konsekvenserna av att släppa din AI-lösning till allmänheten. |
Dricks
Varje arkitekturbeslut omfattar en rad överväganden och en uppsättning erkända kompromisser som balanserar olika aspekter av ramverket. Dessa kompromisser anges med den här ikonen .