Utformingsprinsipper for intelligente programarbeidsbelastninger
Veiledning rundt planlegging, utvikling og vedlikehold av intelligente programarbeidsbelastninger er bygget på Power Platform Well-Architected og dens fem grunnpilarer for arkitektur.
Well-Architected-grunnpilar | Sammendrag |
---|---|
Pålitelighet | En intelligent programarbeidsbelastning krever resiliens på arkitekturlaget for å sikre at KI-modeller og arbeidsflyter er svært tilgjengelige og kan gjenopprettes raskt etter feil. Implementer robuste feilhåndteringsmekanismer. En robust arkitektur opprettholder også integriteten til dataene som brukes av modellene for kunstig intelligens, noe som sikrer konsekvente og nøyaktige utdata. |
Sikkerhet | En intelligent programarbeidsbelastning håndterer ofte sensitive data. Beskytt sensitive data som brukes og genereres av modeller for kunstig intelligens. Implementer kryptering, tilgangskontroller og regelmessige sikkerhetsrevisjoner. Sørg for at arbeidsbelastningen etterlever relevante reguleringsstandarder, for eksempel GDPR (EUs personvernforordning) og HIPAA (Health Insurance Portability and Accountability Act), for å beskytte brukernes personvern og data. |
Ytelseseffektivitet | En intelligent programarbeidsbelastning må utformes for å skalere sømløst med økende datavolumer og brukerkrav. Identifiser viktige ytelsesmåleverdier og implementer overvåking for å spore fremdriften mot å oppnå ytelsesmål for arbeidsbelastning. Når det gjelder intelligente programarbeidsbelastninger, tar ytelsen også hensyn til antall forespørsler og samhandlinger som kan fullføres gjennom selvbetjening, noe som ellers ville kreve menneskelig inngripen. |
Driftskvalitet | En intelligent programarbeidsbelastning krever omfattende overvåking og logging for å spore ytelsen og tilstanden til modeller for kunstig intelligens, arbeidsflyter og samtaler. Overvåking bidrar til å raskt identifisere og løse problemer. Operasjonell fortreffelighet-søylen anbefaler å bruke automatisering for å effektivisere driften, redusere manuell inngripen og minimere risikoen for menneskelige feil. |
Opplevelsesoptimalisering | En intelligent programarbeidsbelastning bør prioritere samtaledesign for å sikre en brukervennlig opplevelse som gjør det mulig for brukere å nå sine mål med minimal innsats. Utformingen skal ta hensyn til emner generativ kunstig intelligens ikke kan håndtere og innlemme reservemekanismer. Implementer også mekanismer for å samle inn tilbakemeldinger fra brukere og kontinuerlig forbedre AI-modellene og arbeidsbelastningen basert på denne tilbakemeldingen. |
Pålitelighet
Når du utformer en intelligent programarbeidsbelastning med Power Platform, fokuserer du på fleksibilitet og tilgjengelighet.
- Fleksibilitet er systems evne til å komme seg etter feil og fortsette å fungere.
- Tilgjengelighet sikrer uavbrutt oppetid. Høy tilgjengelighet minimerer nedetid for programmer og forbedrer gjenoppretting etter hendelser.
Pålitelighet er viktig i utviklingen av enhver arbeidsbelastning, og generativ kunstig intelligens er intet unntak. Det er faktisk unike faktorer å vurdere når du konstruerer arbeidsbelastninger for generativ kunstig intelligens. Å gjenkjenne og vektlegge motstandsdyktighet er avgjørende for arbeidsbelastninger for generativ kunstig intelligens for å sikre organisatorisk tilgjengelighet og opprettholde forretningskontinuitet.
Feil kan skje i skyen. I stedet for å prøve å forhindre feil helt, bør målet ditt være å minimere effekten av en enkelt sviktende komponent. Bruk følgende informasjon til å minimere nedetid og sikre at anbefalte fremgangsmåter for høy tilgjengelighet er innebygd i den intelligente programarbeidsbelastningen:
- Sørg for at arbeidsbelastningen kan håndtere feil og fortsette å fungere, selv om den har redusert funksjonalitet. Identifiser potensielle feil og gjør systemet motstandsdyktig, for å tolerere og gjenopprette fra disse feilene.
- Gjør arbeidsbelastningen observerbar slik at utviklingsteam lærer av feil. Identifiser og løs problemer raskt ved å implementere overvåkings-, loggings- og varslingsmekanismer.
- Sørg for at arbeidsbelastningen kan skaleres for å håndtere varierende belastninger, spesielt viktig for arbeidsbelastninger for kunstig intelligens som kan ha varierende krav.
- Implementer robuste mekanismer for feilhåndtering og gjenoppretting. Sett opp automatiserte varsler for systemfeil og ha en klar plan for rask gjenoppretting.
- Valider målarkitekturen og skaleringen ved å forstå målvolumene for nettprat-meldinger eller -samtaler. Målvolumer bidrar også til å validere lisensieringsaspektene til det intelligente programmet og den potensielle effekten på Dataverse-lagring for samtaleutskrifter.
For intelligente programmer som bruker funksjoner for generativ kunstig intelligens, bør du ikke bare vurdere robusthet og tilgjengelighet, men også påliteligheten og nøyaktigheten til svarene fra den intelligente arbeidsbelastningen. Vurder følgende anbefalinger for hver utformingsvurdering:
- Optimaliser for Retrieval Augmented Generation (RAG): Sørg for at dataene er rene og godt strukturerte, opprett effektive innebygginger og indekser for rask henting, og implementer robuste overvåkings- og tilbakemeldingsmekanismer for kontinuerlig forbedring av arbeidsbelastningens ytelse.
- Effektive spørringer: Utform presise og kontekstuelt relevante spørringer for å veilede kunstig intelligens til å gi nøyaktige svar.
- Regelmessig evaluering: Implementer kontinuerlig overvåking og testing av KI-utdata for å vurdere nøyaktighet, relevans og etisk etterlevelse.
- Tilbakemeldingssløyfer: Opprett tilbakemeldingsmekanismer der brukere kan rapportere unøyaktigheter, som deretter kan brukes til å finjustere og forbedre modellene. Microsoft Copilot Studio gir kundetilfredshetsanalyse, som gir praktisk innsikt i drivere for tilfredshet eller misnøye med agentens svar.
- Domenespesifikk opplæring: Finjuster modeller på domenespesifikke data for å forbedre nøyaktigheten i bestemte sammenhenger.
- Regelmessige oppdateringer: Oppdater modeller med jevne mellomrom med nye data for å opprettholde relevansen og nøyaktigheten.
- Ukjente intensjoner: Håndter ukjente hensikter ved å bruke generative svar til å finne svar fra tilgjengelige datakilder og ved å bruke basisemnet til å integrere med andre systemer.
Sikkerhet
I en delt ansvar-modell:
- Organisasjoner er primært ansvarlige for å administrere og drifte arbeidsbelastninger.
- Microsoft administrerer sikkerheten til den underliggende infrastrukturen, inkludert datasentre, nettverkssikkerhet og fysiske sikkerhetstiltak og innebygde sikkerhetsfunksjoner som kryptering, identitetsadministrasjon og etterlevelse av bransjestandarder. Finn ut mer i Sikkerhet i Microsoft Power Platform og Sikkerhet og styring i Copilot Studio.
Vi anbefaler at du regelmessig vurderer tjenestene og teknologiene for å sikre at sikkerhetsstillingen din tilpasser seg trussellandskapet som er i stadig utvikling. Å etablere en klar forståelse av modellen for delt ansvar med leverandører er avgjørende når man samarbeider for å implementere sikkerhetstiltak.
Du kan bruke flere metoder for å sikre intelligente programarbeidsbelastninger:
- Brukerautentisering og tilgangskontroll: Implementer robuste autentiserings- og tilgangskontrolltiltak for å sikre at bare autoriserte brukere har tilgang til den intelligente programarbeidsbelastningen. Uautorisert tilgang til den intelligente programarbeidsbelastningen kan føre til databrudd, misbruk av ressurser og potensiell eksponering av sensitiv informasjon. Svake eller ineffektive godkjenningsmekanismer kan også føre til kompromitterte brukerkontoer.
- Samsvar: Sørg for at data beskyttes og administreres i samsvar med forskriftsmessige krav. Forstå lokale forskrifter, og hold deg informert om lokale databeskyttelseslover og sørg for at datalagringsstrategien din etterlever disse forskriftene.
- Integrering: Sikre alle integrasjoner med tjenestekontohavere. Overvåk og beskytt nettverksintegriteten til interne og eksterne endepunkter gjennom sikkerhetsfunksjoner og -enheter, for eksempel brannmurer eller brannmurer for nettprogrammer.
- Kontinuerlig overvåking og revisjon: Overvåk og revider kontinuerlig arbeidsbelastningsaktivitetene for å oppdage og reagere proaktivt.
- Azure-sikkerhetsverktøy: Bruk de innebygde Azure-sikkerhetsverktøyene, for eksempel Microsoft Defender for Cloud og Azure Policy, for å overvåke og håndheve sikkerhetspolicyer.
- Opplæring for ansatte: Lær ansattes om anbefalte fremgangsmåter for personvern og viktigheten av å holde seg til datalagringskrav.
Ytelseseffektivitet
Ytelseseffektivitet er arbeidsbelastningens evne til å skalere effektivt for å oppfylle kravene som stilles til den av brukerne.
Øk ytelseseffektiviteten ved å:
- Forstå målvolumer for å validere målarkitekturen og skaleringen. Målvolumer bidrar også til å validere lisensieringsaspektene for generativ KI (agent) og den potensielle effekten på Dataverse-lagring for samtaleutskrifter.
- Forstå plattformgrenser. Når du integrerer den intelligente programarbeidsbelastningen med eksterne systemer, for eksempel gjennom Power Automate- eller HTTP-forespørsler, er det viktig å validere at hver komponent kan håndtere belastningen.
- Overvåk ytelsen kontinuerlig og oppdag avvik ved hjelp av verktøy som Azure Monitor, Log Analytics, Application Insights og varsler.
- Forstå forventede svartider for:
- Første nettpratinnlasting og første meldingssvar
- Maksimal ventetid for agenten for å svare på brukerspørringer
- Tilnærming for håndtering av langvarige handlinger (f.eks. å vente på at et eksternt system skal returnere data)
- Optimalisering av avledningshastigheten, eller hastigheten som forespørsler fullføres med på en selvbetjent måte på grunn av automatisering (redusere antall forespørsler som krever menneskelig hjelp). Finn ut mer i Ytelsesoptimalisering for intelligente programarbeidsbelastninger.
Å vurdere hvert av disse aspektene hjelper deg med å bygge en intelligent programarbeidsbelastning med en konsekvent, sammenhengende brukeropplevelse.
Driftskvalitet
Fremragende drift innebærer å utvikle effektive prosesser for å støtte den intelligente arbeidsbelastningen for programmer.
Driftsfeil kan påvirke andre utformingsområder, så vel som den generelle suksessen til den intelligente programarbeidsbelastningen. Det er viktig å skreddersy driftsprosessene for å støtte en intelligent programarbeidsbelastning i produksjonen. Følgende anbefalinger fremmer fremragende drift:
- Automatiser prosesser for bygging og frigivelse. Helautomatiserte bygge- og utgivelsesprosesser reduserer friksjon og øker hastigheten ved utrulling av oppdateringer, noe som gir repeterbarhet og konsekvens på tvers av miljøer. Automatisering forkorter tilbakemeldingssløyfen, fra utviklere som fremmer endringer, til å få innsikt i kodekvalitet, testdekning, resiliens, sikkerhet og ytelse, som alle bidrar til utviklerproduktivitet.
- Opprettholde styring og samsvar
- Analyser miljøets ytelse og helse i produksjonen.
- Vedlikehold dokumentasjon som fanger opp:
- Feilsøke prosedyrer
- Nødgjenopprettingsplaner
- Gi utbedringsveiledning om hvordan du kan akselerere prosessen med å løse problemer.
- Ta i bruk kontinuerlig driftsforbedring. Prioriter rutinemessig forbedring av systemet og brukeropplevelsen. Bruk en tilstandsmodell for å forstå og måle driftseffektivitet, sammen med tilbakemeldingsmekanismer for å gjøre det mulig for programteam å forstå og løse mangler på en iterativ måte.
Disse anbefalingene kan hjelpe teamet ditt med å samarbeide på en måte som er effektiv og gjennomsiktig.
Opplevelsesoptimalisering
En intelligent programarbeidsbelastning bør prioritere samtaledesign for å sikre en brukervennlig opplevelse som gjør det mulig for brukere å nå sine mål med minimal innsats. Utformingen bør ta for seg emner som den generative kunstige intelligensen ikke kan håndtere, og inkludere reservemekanismer. Implementer også mekanismer for å samle inn tilbakemeldinger fra brukere og kontinuerlig forbedre AI-modellene og arbeidsbelastningen basert på denne tilbakemeldingen.
Optimalisering av brukeropplevelsen for en intelligent programarbeidsbelastning innebærer flere viktige hensyn:
Samtaleutforming: Utform samtaler som er intuitive og enkle å navigere. Bruk klart og konsist språk, og sørg for at kunstig intelligens kan håndtere vanlige brukerspørringer effektivt. Fokuser på å hjelpe brukerne med å nå målene sine med minimal innsats. Forstå brukerens intensjoner og gi relevante svar raskt for å sikre en sømløs og effektiv brukeropplevelse.
Håndteringsbegrensninger: Implementer reservemekanismer for emner som generativ kunstig intelligens ikke kan håndtere, for eksempel omdirigering av brukere til kundeservicerepresentanter eller alternative ressurser. Utform robuste feilhåndteringsprosesser for å håndtere uventede inndata på en elegant måte. Informer brukere når kunstig intelligens ikke kan behandle forespørselen deres og tilby alternativer.
Tilbakemeldinger fra brukere: Integrer mekanismer for å samle tilbakemeldinger fra brukere kontinuerlig. Microsoft Copilot Studio gir kundetilfredshetsanalyse, som gir praktisk innsikt i drivere for tilfredshet eller misnøye med agentens svar. Bruk de innsamlede tilbakemeldingene til å finjustere og forbedre modellene for kunstig intelligens og den totale arbeidsbelastningen. Regelmessige oppdateringer basert på brukerinndata kan forbedre brukeropplevelsen betydelig.
Tilpassing og egendefinering: Tilpass spørringer og instruksjoner for å tilpasse seg dine spesifikke brukstilfeller og brukerbehov, for å sikre mer nøyaktige og relevante svar. Bruk dynamisk kjeding til å automatisere utløsere og administrere emneflyter effektivt for å redusere behovet for manuelt forhåndsdefinerte emner og forbedre evnen til kunstig intelligens til å gjenkjenne brukerintensjoner. Finn ut mer i Optimaliser spørringer og emnekonfigurasjon.
Neste trinn
Well-Architected Framework-utformingsprinsippene er innlemmet i intelligente utformingsområder for programarbeidsbelastning. Hvert utformingsområde gir målrettet veiledning for å hjelpe deg med å få rask tilgang til informasjonen du trenger for å forbedre produktiviteten effektivt.
Start med å se gjennom utformingshensynene som er nødvendige for å støtte en arbeidsbelastning: