Designprinciper för intelligenta apparbetsbelastningar

Artikel
01/15/2025

Vägledning kring planering, utveckling och underhåll av intelligenta programarbetsbelastningar bygger på Power Platform välstrukturerad och dess fem grundpelare för arkitektonisk excellens.

Välstrukturerad pelare	Sammanfattning
Tillförlitlighet	En intelligent programarbetsbelastning kräver motståndskraft på arkitekturlagret för att säkerställa att AI-modeller och arbetsflöden har hög tillgänglighet och snabbt kan återställas efter fel. Implementera robusta felhanteringsmekanismer. En motståndskraftig arkitektur upprätthåller också integriteten hos data som används av AI-modellerna, vilket säkerställer konsekventa och korrekta utdata.
Säkerhet	En intelligent programarbetsbelastning hanterar ofta känsliga data. Skydda känsliga data som används och genereras av AI-modeller. Implementera kryptering, åtkomstkontroller och regelbundna säkerhetsgranskningar. Se till att arbetsbelastningen följer relevanta regelstandarder, till exempel GDPR (allmän dataskyddsförordning) och HIPAA (Health Insurance Portability and Accountability Act), för att skydda användarnas integritet och data.
Prestandaeffektivitet	En intelligent programarbetsbelastning måste utformas för att skalas sömlöst med ökande datavolymer och användarkrav. Identifiera viktiga prestandamått och implementera övervakning för att spåra förloppet mot att uppnå prestandamål för arbetsbelastningen. När det gäller intelligenta programarbetsbelastningar tar prestanda även hänsyn till antalet begäranden och interaktioner som kan slutföras via självbetjäning, vilket annars skulle kräva mänsklig inblandning.
Bästa driftförutsättningar	En intelligent programarbetsbelastning kräver omfattande övervakning och loggning för att spåra prestanda och hälsa för AI-modeller, arbetsflöden och konversationer. Övervakning hjälper till att snabbt identifiera och lösa problem. Grundpelaren för driftseffektivitet rekommenderar att du använder automatisering för att effektivisera verksamheten, minska manuella ingrepp och minimera risken för mänskliga fel.
Upplevelseoptimering	En intelligent programarbetsbelastning bör prioritera konversationsdesign för att säkerställa en användarvänlig upplevelse som gör det möjligt för användarna att uppnå sina mål med minimal ansträngning. Designen bör ta hänsyn till ämnen som den generativa AI:n inte kan hantera och införliva reservmekanismer. Implementera även mekanismer för att samla in användarfeedback och kontinuerligt förfina AI-modellerna och arbetsbelastningen baserat på denna feedback.

Tillförlitlighet

När du utformar en intelligent programarbetsbelastning med Power Platform, bör du fokusera på motståndskraft och tillgänglighet.

Motståndskraft är förmågan hos ett system att återhämta sig från fel och fortsätta att fungera.
Tillgänglighet garanterar oavbruten drifttid. Hög tillgänglighet minimerar programmets stilleståndstid och förbättrar återställningen från incidenter.

Tillförlitlighet är viktigt i utvecklingen av alla arbetsbelastningar, och generativ AI är inget undantag. Faktum är att det finns unika faktorer att ta hänsyn till när man konstruerar generativa AI-arbetsbelastningar. Att känna igen och betona motståndskraft är viktigt för generativa AI-arbetsbelastningar för att säkerställa organisationens tillgänglighet och upprätthålla affärskontinuitet.

Fel kan inträffa i molnet. I stället för att försöka förhindra fel helt och hållet bör ditt mål vara att minimera effekterna av en enda misslyckad komponent. Använd följande information för att minimera stilleståndstiden och se till att rekommenderade metoder för hög tillgänglighet är inbyggda i din intelligenta programarbetsbelastning:

Se till att arbetsbelastningen kan hantera fel och fortsätta att fungera, även om funktionerna är begränsade. Identifiera potentiella fel och gör systemet motståndskraftigt för att tolerera och återhämta sig från dessa fel.
Gör arbetsbelastningen observerbar så att utvecklingsteamen lär sig av misslyckanden. Identifiera och åtgärda problem snabbt genom att implementera mekanismer för övervakning, loggning och aviseringar.
Se till att arbetsbelastningen kan skalas för att hantera olika belastningar, särskilt viktigt för AI-arbetsbelastningar som kan ha varierande krav.
Implementera robusta mekanismer för felhantering och återställning. Ställ in automatiska varningar för systemfel och ha en tydlig plan för snabb återställning.
Verifiera målarkitekturen och skalningen genom att förstå målvolymerna för chattmeddelanden eller konversationer. Målvolymer hjälper också till att verifiera licensieringsaspekterna av det intelligenta programmet och den potentiella effekten på Dataverse-lagringen för konversationsavskrifter.

För intelligenta program som använder generativa AI-funktioner bör du inte bara tänka på motståndskraft och tillgänglighet, utan även tillförlitligheten och noggrannheten i svaren från den intelligenta arbetsbelastningen. Tänk på följande rekommendationer för varje designövervägande:

Optimera för hämtningsförstärkt generering (RAG): Se till att dina data är rena och välstrukturerade, skapa effektiva inbäddningar och index för snabb hämtning och implementera robusta övervaknings- och feedbackmekanismer för att kontinuerligt förbättra arbetsbelastningens prestanda.
Effektiva prompter: Utforma exakta och kontextuellt relevanta prompter för att vägleda AI att producera korrekta svar.
Regelbunden utvärdering: Implementera kontinuerlig övervakning och testning av AI-resultat för att bedöma noggrannhet, relevans och etisk efterlevnad.
Återkopplingsloopar: Upprätta återkopplingsmekanismer där användare kan rapportera felaktigheter, som sedan kan användas för att förfina och förbättra modellerna. Microsoft Copilot Studio tillhandahåller analyser av kundnöjdhet, som ger användbara insikter om drivkrafter för tillfredsställelse eller missnöje med dina agentens svar.
Domänspecifik träning: Finjustera modeller på domänspecifika data för att förbättra noggrannheten i specifika kontexter.
Regelbundna uppdateringar: Uppdatera regelbundet modeller med nya data för att bibehålla deras relevans och noggrannhet.
Okända avsikter: Hantera okända avsikter med hjälp av Generativa svar to find answers from available data sources and by using the Reservämne för att integrera med andra system.

Säkerhet

I en delad ansvarsmodell:

Organisationer är främst ansvariga för att hantera och driva arbetsbelastningar.
Microsoft hanterar säkerheten för den underliggande infrastrukturen, inklusive datacenter, nätverkssäkerhet och fysiska säkerhetsåtgärder och inbyggda säkerhetsfunktioner som kryptering, identitetshantering och efterlevnad av branschstandarder. Läs mer i Säkerhet i Microsoft Power Platform och Copilot Studio säkerhet och styrning.

Vi rekommenderar att du regelbundet utvärderar tjänsterna och teknikerna för att säkerställa att din säkerhetsstatus anpassas till det föränderliga hotlandskapet. Att skapa en tydlig förståelse för modellen med delat ansvar med leverantörer är viktigt när man samarbetar för att implementera säkerhetsåtgärder.

Du kan använda flera metoder för att skydda dina intelligenta programarbetsbelastningar:

Användarautentisering och åtkomstkontroll: Implementera robusta autentiserings- och åtkomstkontrollåtgärder för att säkerställa att endast behöriga användare kan komma åt den intelligenta programarbetsbelastningen. Obehörig åtkomst till den intelligenta programarbetsbelastningen kan leda till dataintrång, missbruk av resurser och potentiell exponering av känslig information. Svaga eller ineffektiva autentiseringsmekanismer kan också leda till komprometterade användarkonton.
Efterlevnad: Se till att data skyddas och hanteras i enlighet med regelkrav. Förstå lokala bestämmelser och håll dig informerad om lokala dataskyddslagar och se till att din strategi för datahemvist följer dessa regler.
Integrering: Skydda alla integreringar med tjänstens huvudnamn. Övervaka och skydda nätverksintegriteten för interna och externa slutpunkter med hjälp av säkerhetsfunktioner och installationer, till exempel brandväggar eller brandväggar för webbaserade program.
Löpande övervakning och granskning: Övervaka och granska arbetsbelastningsaktiviteterna kontinuerligt för att identifiera och svara proaktivt.
Azure säkerhetsverktyg: Använd Azure inbyggda säkerhetsverktyg, till exempel Microsoft Defender för molnet och Azure Policy, för att övervaka och tillämpa säkerhetsprinciper.
Utbildning av medarbetare: Utbilda medarbetarna om bästa praxis gällande dataskydd och vikten av att uppfylla kraven på datahemvist.

Prestandaeffektivitet

Prestandaeffektivitet är möjligheten för din arbetsbelastning att effektivt skala för att uppfylla de krav som användarna ställer på den.

Öka prestandaeffektiviteten genom att:

Förstå målvolymer för att verifiera målarkitekturen och skalan. Målvolymer hjälper också till att verifiera licensieringsaspekterna av generativ AI (agent) och den potentiella effekten på Dataverse-lagringen för konversationsavskrifter.
Förstå plattformsgränser. När du integrerar din intelligenta programarbetsbelastning med externa system, till exempel via Power Automate eller HTTP-begäranden, är det viktigt att verifiera att varje komponent kan hantera belastningen.
Övervaka prestanda kontinuerligt och identifiera avvikelser med hjälp av verktyg som Azure Monitor, Log Analytics Application Insights och aviseringar.
Förstå de förväntade svarstiderna för:
- Första chattinläsningen och första meddelandesvaret
- Maximal svarstid för agent för att besvara användarfrågor
- Metod för att hantera långvariga åtgärder (till exempel vänta på att ett externt system ska returnera data)
Optimera avböjningshastigheten, eller den hastighet med vilken förfrågningar slutförs på ett självbetjäningssätt på grund av automatisering (vilket minskar antalet förfrågningar som kräver mänsklig hjälp). Läs mer i Prestandaoptimering för intelligenta apparbetsbelastningar.

Genom att ta hänsyn till var och en av dessa aspekter kan du skapa en intelligent programarbetsbelastning med en konsekvent och sammanhängande användarupplevelse.

Bästa driftförutsättningar

Driftseffektivitet innebär att utveckla effektiva processer för att stödja din intelligenta programarbetsbelastning.

Driftfel kan påverka andra designområden samt den övergripande framgången för den intelligenta programarbetsbelastningen. Det är viktigt att skräddarsy dina operativa processer för att stödja en intelligent programarbetsbelastning i produktion. Följande rekommendationer ökar driftseffektiviteten:

Automatisera bygg- och lanseringsprocesser. Helt automatiserade bygg- och lanseringsprocesser minskar friktionen och ökar hastigheten för distribution av uppdateringar, vilket ger repeterbarhet och konsekvens i olika miljöer. Automatisering förkortar återkopplingsloopen, från utvecklare som driver ändringar till att få insikter om kodkvalitet, testramverk, resiliens, säkerhet och prestanda, som alla bidrar till utvecklarnas produktivitet.
Upprätthålla styrning och efterlevnad.
Analysera din miljös prestanda och hälsa i produktion.
Upprätthåll dokumentation som innehåller:
- Felsöka procedurer
- Programåterställningsplaner
Ge reparationsvägledning om hur du påskyndar processen för att lösa problem.
Omfamna kontinuerlig förbättring av verksamheten. Prioritera rutinmässig förbättring av systemet och användarupplevelsen. Använd en hälsomodell för att förstå och mäta driftseffektivitet, tillsammans med feedbackmekanismer för att göra det möjligt för programteam att förstå och åtgärda luckor på ett iterativt sätt.

Dessa rekommendationer kan hjälpa ditt team att samarbeta på ett sätt som är effektivt och transparent.

Upplevelseoptimering

En intelligent programarbetsbelastning bör prioritera konversationsdesign för att säkerställa en användarvänlig upplevelse som gör det möjligt för användarna att uppnå sina mål med minimal ansträngning. Designen bör ta upp ämnen som den generativa AI:n inte kan hantera och inkludera reservmekanismer. Implementera även mekanismer för att samla in användarfeedback och kontinuerligt förfina AI-modellerna och arbetsbelastningen baserat på denna feedback.

Att optimera användarupplevelsen för en intelligent programarbetsbelastning omfattar flera viktiga överväganden:

Konversationsdesign: Utforma konversationer som är intuitiva och lätta att navigera. Använd ett tydligt och koncist språk och se till att AI kan hantera vanliga användarfrågor på ett effektivt sätt. Fokusera på att hjälpa användarna att nå sina mål med minimal ansträngning. Förstå användarnas avsikter och ge relevanta svar snabbt för att säkerställa en sömlös och effektiv användarupplevelse.
Hanteringsbegränsningar: Implementera reservmekanismer för ämnen som generativ AI inte kan hantera, t.ex. omdirigering av användare till kundtjänstrepresentanter eller tillhandahållande av alternativa resurser. Utforma robusta felhanteringsprocesser för att hantera oväntade indata på ett smidigt sätt. Informera användarna när AI inte kan behandla deras begäran och erbjuda alternativ.
Användarfeedback: Integrera mekanismer för att samla in användarfeedback kontinuerligt. Microsoft Copilot Studio tillhandahåller analyser av kundnöjdhet, som ger användbara insikter om drivkrafter för tillfredsställelse eller missnöje med dina agentens svar. Använd den insamlade feedbacken för att förfina och förbättra AI-modellerna och den övergripande arbetsbelastningen. Regelbundna uppdateringar baserade på användarinmatning kan förbättra användarupplevelsen avsevärt.
Anpassning och personalisering: Anpassa prompter och instruktioner så att de överensstämmer med dina specifika användningsfall och användarbehov, för att säkerställa mer korrekta och relevanta svar. Använd dynamisk länkning för att automatisera utlösare och hantera ämnesflöden effektivt för att minska behovet av manuellt fördefinierade ämnen och förbättra AI:s förmåga att känna igen användarens avsikt. Läs mer i Optimera konfiguration av prompter och ämnen.

Gå vidare

Designprinciperna för Well-Architected Framework ingår i designområden för intelligenta programarbetsbelastningar. Varje designområde ger riktad vägledning som hjälper dig att snabbt komma åt den information du behöver för att förbättra produktiviteten på ett effektivt sätt.

Börja med att granska de designöverväganden som krävs för att stödja en arbetsbelastning:

Dela via