Designprinciper för intelligenta programarbetsbelastningar
Vägledning kring planering, utveckling och underhåll av intelligenta programarbetsbelastningar bygger på Power Platform Well-Architected och dess fem grundpelare för arkitektonisk excellens.
Välbyggd pelare | Sammanfattning |
---|---|
Tillförlitlighet | En intelligent programarbetsbelastning kräver motståndskraft på lagret arkitektur för att säkerställa att AI-modeller och arbetsflöden har hög tillgänglighet och snabbt kan återställas efter fel. Implementera robusta mekanismer för felhantering. En motståndskraftig arkitektur upprätthåller också integriteten för data som används av AI-modellerna, vilket säkerställer konsekventa och korrekta utdata. |
Säkerhet | En intelligent programarbetsbelastning hanterar ofta känsliga data. Skydda känsliga data som används och genereras av AI-modeller. Implementera kryptering, åtkomstkontroller och regelbundna säkerhetsgranskningar. Se till att arbetsbelastningen följer relevanta regleringsstandarder, till exempel GDPR (allmän dataskyddsförordning) och HIPAA (Health Insurance Portability and Accountability Act), för att skydda användarnas integritet och data. |
Prestanda effektivitet | En intelligent programarbetsbelastning måste utformas för att skalas sömlöst med ökande datavolymer och användarkrav. Identifiera viktiga prestandamått och implementera övervakning för att spåra förloppet mot att uppnå prestandamål för arbetsbelastningar. När det gäller intelligenta programarbetsbelastningar tar prestanda också hänsyn till antalet begäranden och interaktioner som kan slutföras via självbetjäning, vilket annars skulle kräva mänsklig inblandning. |
Utmärkt driftseffektivitet | En intelligent programarbetsbelastning kräver omfattande övervakning och loggning för att spåra prestanda och hälsa för AI-modeller, arbetsflöden och konversationer. Övervakning hjälper till att snabbt identifiera och lösa problem. Grundpelaren för driftseffektivitet rekommenderar att du använder automatisering för att effektivisera driften, minska manuella ingrepp och minimera risken för mänskliga fel. |
Optimering av upplevelsen | En intelligent programarbetsbelastning bör prioritera konversationsdesign för att säkerställa en användarvänlig upplevelse som gör det möjligt för användarna att uppnå sina mål med minimal ansträngning. Designen bör ta hänsyn till ämnen som den generativa AI:n inte kan hantera och införliva reservmekanismer. Implementera även mekanismer för att samla in användarfeedback och kontinuerligt förfina AI-modellerna och arbetsbelastningen baserat på denna feedback. |
Tillförlitlighet
När du utformar en intelligent programarbetsbelastning med Power Platform fokus på motståndskraft och tillgänglighet.
- Motståndskraft är ett systems förmåga att återhämta sig från fel och fortsätta att fungera.
- Tillgänglighet säkerställer oavbruten drifttid. Hög tillgänglighet minimerar programmets avbrottstid och förbättrar återställningen efter incidenter.
Tillförlitlighet är viktigt i utvecklingen av alla arbetsbelastningar, och generativ AI är inget undantag. Faktum är att det Dit finns unika faktorer att ta hänsyn till när man konstruerar generativa AI-arbetsbelastningar. Att känna igen och betona motståndskraft är viktigt för generativa AI-arbetsbelastningar för att säkerställa organisationens tillgänglighet och upprätthålla affärskontinuitet.
Fel kan inträffa i molnet. I stället för att försöka förhindra fel helt och hållet bör ditt mål vara att minimera effekterna av en enda misslyckad komponent. Använd följande information för att minimera stilleståndstiden och se till att rekommenderade metoder för hög tillgänglighet är inbyggda i din intelligenta programarbetsbelastning:
- Se till att arbetsbelastningen kan hantera fel och fortsätta att fungera, även om den har begränsad funktionalitet. Identifiera potentiella fel och gör systemet motståndskraftigt för att tolerera och återhämta sig från dessa fel.
- Gör arbetsbelastningen observerbar så att utvecklingsteamen lär sig av fel. Identifiera och åtgärda problem snabbt genom att implementera mekanismer för övervakning, loggning och aviseringar.
- Se till att arbetsbelastningen kan skalas för att hantera olika belastningar, särskilt viktigt för AI-arbetsbelastningar som kan ha fluktuerande krav.
- Implementera robusta mekanismer för felhantering och återställning. Ställ in automatiska varningar för systemfel och ha en tydlig plan för snabb återställning.
- Verifiera målarkitekturen och skalningen genom att förstå målvolymerna för chattmeddelanden eller konversationer. Målvolymer hjälper också till att validera licensieringsaspekterna av det intelligenta programmet och den potentiella effekten på Dataverse lagringen för konversationsavskrifter.
För intelligenta program som använder generativa AI-funktioner bör du inte bara överväga motståndskraft och tillgänglighet, utan även tillförlitligheten och noggrannheten i de svar som tillhandahålls av den intelligenta arbetsbelastningen. Överväg följande rekommendationer för varje designövervägande:
- Optimera för Retrieval Augmented Generation (RAG): Se till att dina data är rena och välstrukturerade, skapa effektiva inbäddningar och index för snabb hämtning och implementera robusta övervaknings- och feedbackmekanismer för att kontinuerligt förbättra arbetsbelastningens prestanda.
- Effektiva uppmaningar: Utforma exakta och kontextuellt relevanta uppmaningar för att guide AI att producera korrekta svar.
- Regelbunden utvärdering: Implementera kontinuerlig övervakning och testning av AI-resultat för att bedöma noggrannhet, relevans och etisk efterlevnad.
- Återkopplingsslingor: Upprätta återkopplingsmekanismer där användare kan rapportera felaktigheter, som sedan kan användas för att förfina och förbättra modellerna. Microsoft Copilot Studio Tillhandahåller kundnöjdhetsanalyser, som ger användbara insikter om drivkrafter för tillfredsställelse eller missnöje med din andrepilots svar.
- Domänspecifik träning: Finjustera modeller på domänspecifika data för att förbättra noggrannheten i specifika sammanhang.
- Regelbundna uppdateringar: Uppdatera regelbundet modeller med nya data för att behålla deras relevans och noggrannhet.
- Okända avsikter: Hantera okända avsikter genom att använda generativa svar för att hitta svar från tillgängliga datakällor och genom att använda reservavsnittet för att integrera med andra system.
Säkerhet
I en modell med delat ansvar:
- Organisationer ansvarar i första hand för att hantera och driva arbetsbelastningar.
- Microsoft Hanterar säkerheten för den underliggande infrastrukturen, inklusive datacenter, nätverkssäkerhet och fysiska säkerhetsåtgärder och inbyggda säkerhetsfunktioner som kryptering, identitetshantering och efterlevnad av branschstandarder. Läs mer i Säkerhet i Microsoft Power Platform och Copilot Studio säkerhet och styrning.
Vi rekommenderar att du regelbundet utvärderar tjänsterna och teknikerna för att säkerställa att din säkerhetsstatus anpassas till det föränderliga hotlandskapet. Det är viktigt att skapa en tydlig förståelse för modellen med delat ansvar med leverantörer när man samarbetar för att implementera säkerhetsåtgärder.
Du kan använda flera metoder för att skydda dina intelligenta programarbetsbelastningar:
- Användarautentisering och åtkomstkontroll: Implementera robusta åtgärder för autentisering och åtkomstkontroll för att säkerställa att endast behöriga användare kan komma åt den intelligenta programarbetsbelastningen. Obehörig åtkomst till den intelligenta programarbetsbelastningen kan leda till dataintrång, missbruk av resurser och potentiell exponering av känslig information. Svaga eller ineffektiva autentiseringsmekanismer kan också leda till komprometterade användarkonton.
- Efterlevnad: Se till att data skyddas och hanteras i enlighet med regelkrav. Förstå lokala bestämmelser och håll dig informerad om lokala dataskyddslagar och se till att din strategi för datahemvist följer dessa bestämmelser.
- Integrering: Skydda alla integreringar med tjänstens huvudnamn. Övervaka och skydda nätverksintegriteten för interna och externa slutpunkter med hjälp av säkerhetsfunktioner och enheter, till exempel brandväggar eller brandväggar för webbaserade program.
- Löpande övervakning och granskning: Övervaka och granska arbetsbelastningsaktiviteterna kontinuerligt för att identifiera och svara proaktivt.
- Azures säkerhetsverktyg: Använd Azures inbyggda säkerhetsverktyg, till exempel Microsoft Defender för molnet och Azure Policy, för att övervaka och genomdriva säkerhetsprinciper.
- Personalutbildning: Utbilda anställda om bästa praxis för dataskydd och vikten av att följa kraven på datahemvist.
Prestandaeffektivitet
Prestandaeffektivitet är möjligheten för din arbetsbelastning att effektivt skala för att uppfylla de krav som ställs på den av användare.
Öka prestandaeffektiviteten genom att:
- Förstå målvolymer för att verifiera målarkitekturen och skalan. Målvolymer hjälper också till att validera licensieringsaspekterna av copilot och den potentiella effekten på Dataverse lagringen för konversationsavskrifter.
- Förstå plattformsgränser. När du integrerar din intelligenta programarbetsbelastning med externa system, till exempel via Power Automate eller HTTP-begäranden, är det viktigt att verifiera att varje komponent kan hantera belastningen.
- Kontinuerligt övervaka prestanda och identifiera avvikelser med hjälp av verktyg som Azure Monitor, Log Analytics Application Insights och aviseringar.
- Förstå de förväntade svaren tiderna för:
- Första chattinläsningen och det första svaret på meddelandet
- Maximal svarstid för copiloten att svara på användarfrågor
- Metod för att hantera långvariga åtgärder (till exempel att vänta på att ett externt system ska returnera data)
- Optimera avböjningshastigheten, eller den hastighet med vilken förfrågningar slutförs på ett självbetjäningssätt på grund av automatisering (vilket minskar antalet förfrågningar som kräver live-handläggare hjälp). Läs mer i Prestandaoptimering för intelligenta programarbetsbelastningar.
Genom att överväga var och en av dessa aspekter kan du skapa en intelligent programarbetsbelastning med en konsekvent, sammanhängande användarupplevelse.
Bästa driftförutsättningar
Utmärkt driftseffektivitet innebär att utveckla effektiva processer för att stödja din intelligenta programarbetsbelastning.
Driftfel kan påverka andra designområden samt den övergripande framgången för den intelligenta programarbetsbelastningen. Det är viktigt att skräddarsy dina operativa processer för att stödja en intelligent programarbetsbelastning i produktion. Följande rekommendationer främjar driftseffektivitet:
- Automatisera bygg- och lanseringsprocesser. Helt automatiserade bygg- och lanseringsprocesser minskar friktionen och ökar hastigheten för att distribuera uppdateringar, vilket ger repeterbarhet och konsekvens i olika miljöer. Automatisering förkortar återkopplingsloopen, från utvecklare som driver ändringar till att få insikter om kodkvalitet, testtäckning, återhämtning, säkerhet och prestanda, som alla bidrar till utvecklarnas produktivitet.
- Upprätthåll styrning och efterlevnad.
- Analysera din miljös prestanda och hälsa i produktion.
- Underhåll dokumentation som samlar in:
- Procedurer för felsökning
- Planer för haveriberedskap
- Ge reparationsvägledning om hur du påskyndar processen för att lösa problem.
- Omfamna kontinuerlig förbättring av verksamheten. Prioritera rutinmässig förbättring av systemet och användarupplevelsen. Använd en hälsomodell för att förstå och mäta driftseffektivitet, tillsammans med feedbackmekanismer för att göra det möjligt för programteam att förstå och åtgärda luckor på ett iterativt sätt.
Dessa rekommendationer kan hjälpa ditt team att samarbeta på ett sätt som är effektivt och transparent.
Optimering av upplevelsen
En intelligent programarbetsbelastning bör prioritera konversationsdesign för att säkerställa en användarvänlig upplevelse som gör det möjligt för användarna att uppnå sina mål med minimal ansträngning. Designen bör ta upp ämnen som den generativa AI:n inte kan hantera och inkludera reservmekanismer. Implementera även mekanismer för att samla in användarfeedback och kontinuerligt förfina AI-modellerna och arbetsbelastningen baserat på denna feedback.
Att optimera användarupplevelsen för en intelligent programarbetsbelastning omfattar flera viktiga överväganden:
Konversationsdesign: Utforma konversationer som är intuitiva och lätta att navigera. Använd ett tydligt och kortfattat språk och se till att AI kan hantera vanliga användarfrågor på ett effektivt sätt. Fokusera på att hjälpa användarna att nå sina mål med minimal ansträngning. Förstå användarnas avsikter och ge relevanta svar snabbt för att säkerställa en sömlös och effektiv användarupplevelse.
Hantera begränsningar: Implementera reservmekanismer för ämnen som den generativa AI inte kan hantera, t.ex. omdirigering av användare till mänskliga agenter eller tillhandahållande av alternativa resurser. Utforma robusta felhanteringsprocesser för att hantera oväntade indata på ett smidigt sätt. Informera användarna när AI inte kan behandla deras begäran och erbjuda alternativ.
Användarfeedback: Integrera mekanismer för att samla in användarfeedback kontinuerligt. Microsoft Copilot Studio Tillhandahåller kundnöjdhetsanalyser som ger användbara insikter om drivkrafter för tillfredsställelse eller missnöje med din andrepilots svar. Använd den insamlade feedbacken för att förfina och förbättra AI-modellerna och den övergripande arbetsbelastningen. Regelbundna uppdateringar baserade på användarinput kan förbättra användarupplevelsen avsevärt.
Anpassning och personalisering: Anpassa uppmaningar och instruktioner för att justera till dina specifika användningsfall och användarbehov, för att säkerställa mer exakta och relevanta svar. Använd dynamisk länkning för att automatisera utlösare och hantera ämnen på ett effektivt sätt för att minska behovet av manuellt fördefinierade ämnen och förbättra AI:ns förmåga att känna igen användarens avsikt. Läs mer i Optimera prompter och ämne konfiguration.
Gå vidare
Well-Architected Framework-designprinciperna ingår i designområden för intelligenta programarbetsbelastningar. Varje designområde ger riktad vägledning som hjälper dig att snabbt komma åt den information du behöver för att förbättra produktiviteten på ett effektivt sätt.
Börja med att granska de designöverväganden som krävs för att stödja en arbetsbelastning: