Ontwerpprincipes van intelligente toepassingsworkloads

Artikel
02/05/2025

Richtlijnen voor het plannen, ontwikkelen en onderhouden van intelligente toepassingsworkloads zijn gebaseerd op Power Platform Well-Architected en de vijf pijlers van architecturale uitmuntendheid.

Well-Architected-pijler	Overzicht
Betrouwbaarheid	Een intelligente toepassingsworkload vereist veerkracht op architectuurniveau om ervoor te zorgen dat AI-modellen en -workflows optimaal beschikbaar zijn en snel kunnen herstellen na een storing. Implementeer robuuste mechanismen voor foutbehandeling. Een veerkrachtige architectuur behoudt bovendien de integriteit van de gegevens die door de AI-modellen worden gebruikt, waardoor consistente en nauwkeurige uitvoer wordt gegarandeerd.
Beveiliging	Een intelligente toepassingsworkload verwerkt vaak gevoelige gegevens. Bescherm gevoelige gegevens die door AI-modellen worden gebruikt en gegenereerd. Implementeer encryptie, toegangscontroles en regelmatige beveiligingsaudits. Zorg ervoor dat de workload voldoet aan de relevante regelgeving, zoals AVG (algemene verordening gegevensbescherming) en HIPAA (Health Insurance Portability and Accountability Act), om de privacy en gegevens van gebruikers te beschermen.
Prestatie-efficiëntie	Een intelligente toepassingsworkload moet zo zijn ontworpen dat deze naadloos kan worden geschaald naarmate de hoeveelheid data en de eisen van de gebruiker toenemen. Identificeer belangrijke prestatie-indicatoren en implementeer monitoring om de voortgang bij te houden ten aanzien van het behalen van de prestatiedoelen voor de workload. In de context van intelligente toepassingsworkload wordt bij de prestatiebeoordeling ook rekening gehouden met het aantal aanvragen en interacties dat via selfservice kan worden voltooid en waarvoor anders menselijke tussenkomst vereist is.
Operationele uitmuntendheid	Voor een intelligente toepassingsworkload is uitgebreide monitoring en logging nodig om de prestaties en de status van AI-modellen, workflows en gesprekken bij te houden. Met monitoring kunt u problemen snel identificeren en oplossen. Op basis van de pijler Operationele uitmuntendheid wordt aanbevolen om automatisering te gebruiken om de bedrijfsvoering te stroomlijnen, handmatige tussenkomst te verminderen en het risico op menselijke fouten te minimaliseren.
Ervaringsoptimalisatie	Een intelligente applicatieworkload moet prioriteit geven aan het ontwerp van conversaties om een gebruikersvriendelijke ervaring te garanderen waarmee gebruikers hun doelen met minimale inspanning kunnen bereiken. Het ontwerp moet rekening houden met onderwerpen die de generatieve AI niet aankan en moet terugvalmechanismen bevatten. Implementeer daarnaast mechanismen om gebruikersfeedback te verzamelen en de AI-modellen en werklast voortdurend te verfijnen op basis van deze feedback.

Betrouwbaarheid

Wanneer u een intelligente toepassingsworkload ontwerpt met Power Platform, moet u zich richten op tolerantie en beschikbaarheid.

Tolerantie is het vermogen van een systeem om te herstellen na fouten en te blijven functioneren.
Beschikbaarheid zorgt voor ononderbroken uptime. Hoge beschikbaarheid minimaliseert de downtime van toepassingen en verbetert het herstel na incidenten.

Betrouwbaarheid is belangrijk bij de ontwikkeling van elke workload, en generatieve AI vormt hierop geen uitzondering. Er zijn namelijk unieke factoren waarmee rekening moet worden gehouden bij het ontwerpen van generatieve AI-workloads. Het erkennen en benadrukken van veerkracht is essentieel voor generatieve AI-workloads om de beschikbaarheid van de organisatie te garanderen en de bedrijfscontinuïteit te handhaven.

Storingen kunnen in de cloud voorkomen. Probeer niet om storingen helemaal te voorkomen, maar probeer de gevolgen van één enkel defect onderdeel tot een minimum te beperken. Gebruik de volgende informatie om de downtime tot een minimum te beperken en ervoor te zorgen dat de aanbevolen werkwijzen voor hoge beschikbaarheid zijn ingebouwd in de workload van uw intelligente toepassing:

Zorg ervoor dat de workload bestand is tegen storingen en dat deze blijft functioneren, zelfs met een verminderde functionaliteit. Identificeer potentiële fouten en maak het systeem veerkrachtig, zodat het deze fouten kan verdragen en ervan kan herstellen.
Maak de workload zichtbaar, zodat ontwikkelteams van fouten kunnen leren. Identificeer problemen vroeg en pak ze snel aan door monitoring-, logging- en waarschuwingsmechanismen te implementeren.
Zorg ervoor dat de workload schaalbaar is om wisselende workloads aan te kunnen. Dit is vooral belangrijk bij AI-workloads waarbij de vraag kan fluctueren.
Implementeer robuuste foutverwerkings- en herstelmechanismen. Stel automatische waarschuwingen in voor systeemstoringen en zorg voor een duidelijk plan voor snel herstel.
Valideer de doelarchitectuur en schaal door inzicht te krijgen in de doelvolumes van chatberichten of conversaties. Doelvolumes helpen ook bij het valideren van de licentieaspecten van de intelligente toepassing en het potentiële effect op Dataverse-opslag van gesprekstranscripties.

Bij intelligente toepassingen die gebruikmaken van generatieve AI-mogelijkheden, moet u niet alleen rekening houden met veerkracht en beschikbaarheid, maar ook met de betrouwbaarheid en nauwkeurigheid van de reacties die de intelligente workload biedt. Houd bij elk ontwerp rekening met de volgende aanbevelingen:

Optimaliseer voor RAG (Retrieval Augmented Generation): zorg dat uw gegevens schoon en goed gestructureerd zijn, maak efficiënte insluitingen en indexen voor snel ophalen en implementeer robuuste monitoring- en feedbackmechanismen om de prestaties van de workload voortdurend te verbeteren.
Effectieve prompts: ontwerp nauwkeurige en contextueel relevante prompts om de AI te helpen nauwkeurige antwoorden te produceren.
Regelmatige evaluatie: voer continue monitoring en tests uit van AI-resultaten om de nauwkeurigheid, relevantie en ethische naleving te beoordelen.
Feedbacklussen: richt feedbackmechanismen in waarmee gebruikers onjuistheden kunnen melden. Deze kunnen vervolgens worden gebruikt om de modellen te verfijnen en verbeteren. Microsoft Copilot Studio biedt klanttevredenheidsanalyse, die bruikbare inzichten bieden in de factoren die van invloed zijn op hoe tevreden of ontevreden klanten zijn met de reacties van uw agent.
Domeinspecifieke training: verfijn modellen met domeinspecifieke gegevens om de nauwkeurigheid in specifieke contexten te verbeteren.
Regelmatige updates: werk modellen regelmatig bij met nieuwe gegevens om hun relevantie en nauwkeurigheid te behouden.
Niet-herkende intenties: verwerk niet-herkende intenties door gebruik te maken van Generatieve antwoorden om antwoorden te zoeken in beschikbare gegevensbronnen en door gebruik te maken van het Terugvalonderwerp om te integreren met andere systemen.

Beveiliging

In een model van gedeelde verantwoordelijkheid:

Organisaties zijn primair verantwoordelijk voor het beheren en uitvoeren van workloads.
Microsoft beheert de beveiliging van de onderliggende infrastructuur, waaronder datacentra, netwerkbeveiliging en fysieke beveiligingsmaatregelen en ingebouwde beveiligingsfuncties zoals encryptie, identiteitsbeheer en naleving van industrienormen. Meer informatie vindt u in Beveiliging in Microsoft Power Platform en Copilot Studio beveiliging en governance.

Wij adviseren u om de services en technologieën regelmatig te evalueren om ervoor te zorgen dat uw beveiliging is afgestemd op het veranderende dreigingslandschap. Het is essentieel om een duidelijk begrip te creëren van het model van gedeelde verantwoordelijkheid met leveranciers wanneer u samenwerkt om beveiligingsmaatregelen te implementeren.

U kunt verschillende methoden gebruiken om uw intelligente toepassingsworkloads te beveiligen:

Gebruikersverificatie en toegangscontrole: implementeer robuuste verificatie- en toegangscontrolemaatregelen om ervoor te zorgen dat alleen gemachtigde gebruikers toegang hebben tot de intelligente toepassingsworkload. Ongeautoriseerde toegang tot de intelligente toepassingsworkload kan leiden tot datalekken, misbruik van bronnen en mogelijke blootstelling van gevoelige informatie. Zwakke of ineffectieve authenticatiemechanismen kunnen er ook toe leiden dat gebruikersaccounts gecompromitteerd raken.
Compliance: zorg ervoor dat gegevens worden beschermd en beheerd in overeenstemming met de wettelijke vereisten. Zorg dat u op de hoogte bent van de lokale regelgeving, blijf op de hoogte van de lokale wetgeving inzake gegevensbescherming en zorg ervoor dat uw strategie voor gegevensresidentie voldoet aan deze regelgeving.
Integratie: beveilig alle integraties met service-principals. Bewaak en bescherm de netwerkintegriteit van interne en externe eindpunten met beveiligingsfuncties en -apparaten, zoals firewalls of firewalls voor webtoepassingen.
Doorlopende monitoring en controle: monitor en controleer voortdurend de workloadactiviteiten om proactief te kunnen detecteren en reageren.
Beveiligingstools van Azure: gebruik de ingebouwde beveiligingstools van Azure, zoals Microsoft Defender voor Cloud en Azure Policy, om beveiligingsbeleid te bewaken en af te dwingen.
Training van werknemers: train werknemers in best practices voor gegevensbescherming en het belang van het naleven van de vereisten voor gegevensresidentie.

Prestatie-efficiëntie

Prestatie-efficiëntie is het vermogen van uw workload om efficiënt te schalen, zodat deze voldoet aan de eisen die gebruikers eraan stellen.

Verhoog de prestatie-efficiëntie door:

Inzicht in doelvolumes om de doelarchitectuur en -schaal te valideren. Doelvolumes helpen ook bij het valideren van de licentieaspecten van de generatieve AI (agent) en het potentiële effect op Dataverse-opslag van gesprekstranscripties.
Inzicht in platformlimieten. Wanneer u de workload van uw intelligente toepassing integreert met externe systemen, bijvoorbeeld via Power Automate of HTTP-aanvragen, is het belangrijk om te valideren dat elk onderdeel de belasting aankan.
Continue bewaking van de prestaties en detectie van afwijkingen met behulp van hulpprogramma's zoals Azure Monitor, Log Analytics, Application Insights en waarschuwingen.
Inzicht in de verwachte responstijden voor:
- Belasting van eerste chatgesprek en eerste berichtrespons
- Maximale latentie voor de agent om gebruikersvragen te beantwoorden
- Benadering voor het verwerken van langlopende acties (bijvoorbeeld wachten tot een extern systeem gegevens retourneert)
Optimaliseren van het afwijzingspercentage, oftewel de snelheid waarmee aanvragen op een selfservice-manier worden afgehandeld dankzij automatisering (waardoor het aantal aanvragen waarvoor menselijke tussenkomst nodig is, wordt verminderd). Meer informatie vindt u in Prestatieoptimalisatie voor intelligente toepassingsworkloads.

Door rekening te houden met elk van deze aspecten, kunt u een intelligente toepassingsworkload bouwen met een consistente, samenhangende gebruikerservaring.

Operationele uitmuntendheid

Operationele uitmuntendheid omvat het ontwikkelen van efficiënte processen ter ondersteuning van uw intelligente toepassingsworkload.

Operationele fouten kunnen gevolgen hebben voor andere ontwerpgebieden en voor het algehele succes van de intelligente toepassingsworkload. Het is belangrijk om uw operationele processen af te stemmen op de ondersteuning van een intelligente toepassingsworkload in productie. De volgende aanbevelingen bevorderen operationele uitmuntendheid:

Automatiseer build- en releaseprocessen. Volledig geautomatiseerde build- en releaseprocessen zorgen voor minder frictie en verhogen de snelheid van de implementatie van updates, wat zorgt voor herhaalbaarheid en consistentie in alle omgevingen. Automatisering verkort de feedbacklus, van ontwikkelaars die wijzigingen doorvoeren tot het verkrijgen van inzicht in de codekwaliteit, testdekking, veerkracht, beveiliging en prestaties. Dit alles draagt bij aan de productiviteit van ontwikkelaars.
Governance en compliance handhaven.
Analyseer de prestaties en de status van uw omgeving in productie.
Houd documentatie bij waarin het volgende is vastgelegd:
- Procedures voor probleemoplossing
- Plannen voor herstel na noodgevallen
Geef advies over hoe u het probleemoplossingsproces kunt versnellen.
Omarm continue operationele verbetering. Geef prioriteit aan routinematige verbetering van het systeem en de gebruikerservaring. Gebruik een gezondheidsmodel om de operationele efficiëntie te begrijpen en te meten, samen met feedbackmechanismen om toepassingsteams in staat te stellen hiaten op een iteratieve manier te begrijpen en aan te pakken.

Deze aanbevelingen kunnen uw team helpen om op een efficiënte en transparante manier samen te werken.

Ervaringsoptimalisatie

Een intelligente applicatieworkload moet prioriteit geven aan het ontwerp van conversaties om een gebruikersvriendelijke ervaring te garanderen waarmee gebruikers hun doelen met minimale inspanning kunnen bereiken. Het ontwerp moet onderwerpen aanpakken die de generatieve AI niet aankan en moet terugvalmechanismen bevatten. Implementeer daarnaast mechanismen om gebruikersfeedback te verzamelen en de AI-modellen en werklast voortdurend te verfijnen op basis van deze feedback.

Bij het optimaliseren van de gebruikerservaring voor een intelligente toepassingsworkload moeten verschillende belangrijke overwegingen in acht worden genomen:

Gespreksontwerp: ontwerp intuïtieve en gemakkelijk te navigeren gesprekken. Gebruik duidelijke en beknopte taal en zorg ervoor dat de AI veelvoorkomende vragen van gebruikers effectief kan verwerken. Richt u erop gebruikers te helpen hun doelen te bereiken met minimale inspanning. Begrijp de bedoelingen van de gebruiker en geef snel relevante antwoorden om een naadloze en efficiënte gebruikerservaring te garanderen.
Omgaan met beperkingen: implementeer terugvalmechanismen voor onderwerpen die de generatieve AI niet aankan, zoals het doorverwijzen van gebruikers naar klantenservicemedewerkers of het aanbieden van alternatieve resources. Ontwerp robuuste foutverwerkingsprocessen om onverwachte invoer op een soepele manier te verwerken. Informeer gebruikers wanneer de AI hun verzoek niet kan verwerken en bied alternatieven.
Feedback van gebruikers: integreer mechanismen om voortdurend feedback van gebruikers te verzamelen. Microsoft Copilot Studio biedt klanttevredenheidsanalyse, die bruikbare inzichten bieden in de factoren die van invloed zijn op hoe tevreden of ontevreden klanten zijn met de reacties van uw agent. Gebruik de verzamelde feedback om de AI-modellen en de algehele workload te verfijnen en verbeteren. Regelmatige updates op basis van gebruikersinvoer kunnen de gebruikerservaring aanzienlijk verbeteren.
Aanpassing en personalisatie: pas prompts en instructies aan op uw specifieke gebruikssituatie en gebruikersbehoeften. Zo krijgt u nauwkeurigere en relevantere antwoorden. Gebruik dynamische ketenvorming om triggers te automatiseren en onderwerpstromen efficiënt te beheren. Zo vermindert u de noodzaak voor handmatig vooraf gedefinieerde onderwerpen en verbetert u het vermogen van de AI om de intentie van de gebruiker te herkennen. Meer informatie vindt u in Prompts en de configuratie van onderwerpen optimaliseren.

Volgende stappen

De ontwerpprincipes van Well-Architected Framework zijn opgenomen in ontwerpgebieden voor intelligente toepassingsworkloads. Elk ontwerpgebied biedt gerichte begeleiding, zodat u snel toegang hebt tot de informatie die u nodig hebt om uw productiviteit efficiënt te verbeteren.

Begin met het bekijken van de ontwerpoverwegingen die nodig zijn om een workload te ondersteunen:

Delen via