Principes de conception des charges de travail d’application intelligentes
Les conseils relatifs à la planification, au développement et à la maintenance des charges de travail d’application intelligentes s’appuient sur Power Platform Well-Architected et ses cinq piliers d’excellence architecturale.
Pilier bien conçu | Synthèse |
---|---|
Fiabilité | Une charge de travail d’application intelligente nécessite une résilience au niveau de l’architecture couche pour garantir que les modèles et les flux de travail d’IA sont hautement disponibles et peuvent récupérer rapidement en cas de panne. Mettre en œuvre des mécanismes robustes de gestion des erreurs. Une architecture résiliente maintient également l’intégrité des données utilisées par les modèles d’IA, garantissant des résultats cohérents et précis. |
Sécurité | Une charge de travail d’application intelligente gère souvent des données sensibles. Protégez les données sensibles utilisées et générées par les modèles d’IA. Mettre en œuvre le cryptage, les contrôles d’accès et les audits de sécurité réguliers. Assurez-vous que la charge de travail est conforme aux normes réglementaires pertinentes, telles que RGPD (guide) et HIPAA (Health Insurance Portability and Accountability Act), pour protéger la confidentialité et les données des utilisateurs. |
Efficacité des performances | Une charge de travail d’application intelligente doit être conçue pour évoluer de manière transparente avec l’augmentation des volumes de données et des demandes des utilisateurs. Identifiez les indicateurs de performance clés et mettez en œuvre une surveillance pour suivre les progrès vers la réalisation des objectifs de performance de la charge de travail. Dans le contexte des charges de travail d’applications intelligentes, les performances prennent également en compte le nombre de demandes et d’interactions qui peuvent être effectuées en libre-service, ce qui nécessiterait autrement une intervention humaine. |
Excellence opérationnelle | Une charge de travail d’application intelligente nécessite une surveillance et une journalisation complètes pour suivre les performances et l’état des modèles d’IA, des flux de travail et des conversations. La surveillance permet d’identifier et de résoudre rapidement les problèmes. Le pilier Excellence opérationnelle recommande d’utiliser l’automatisation pour rationaliser les opérations, réduire les interventions manuelles et minimiser le risque d’erreur humaine. |
Optimisation de l’expérience | Une charge de travail d’application intelligente doit donner la priorité à la conception des conversations pour garantir une expérience conviviale qui permet aux utilisateurs d’atteindre leurs objectifs avec un minimum d’effort. La conception doit tenir compte des sujets que l’IA générative ne peut pas gérer et intégrer des mécanismes de secours. Mettre également en œuvre des mécanismes permettant de recueillir les commentaires des utilisateurs et d’affiner en permanence les modèles d’IA et la charge de travail en fonction de ces commentaires. |
Fiabilité
Lorsque vous concevez une charge de travail d’application intelligente avec Power Platform, concentrez-vous sur la résilience et la disponibilité.
- La résilience est la capacité d’un système à se remettre des défaillances et à continuer à fonctionner.
- La disponibilité garantit une disponibilité ininterrompue. La haute disponibilité minimise les temps d’arrêt des applications et améliore la récupération après les incidents.
La fiabilité est importante dans le développement de toute charge de travail, et l’IA générative ne fait pas exception. En fait, il existe des facteurs uniques à prendre en compte lors de l’ingénierie des charges de travail d’IA générative. Reconnaître et mettre l’accent sur la résilience est essentiel pour les charges de travail d’IA générative afin de garantir la disponibilité de l’organisation et de maintenir la continuité des activités.
Des échecs peuvent survenir dans le cloud. Au lieu d’essayer d’empêcher complètement les pannes, votre objectif devrait être de minimiser les effets d’un seul composant défaillant. Utilisez les informations suivantes pour minimiser les temps d’arrêt et garantir que les pratiques recommandées en matière de haute disponibilité sont intégrées à votre charge de travail d’application intelligente :
- Assurez-vous que la charge de travail peut gérer les pannes et continuer à fonctionner, même avec des fonctionnalités réduites. Identifier les défauts potentiels et rendre le système résilient, pour tolérer et récupérer de ces défauts.
- Rendez la charge de travail observable afin que les équipes de développement apprennent des échecs. Identifiez et résolvez rapidement les problèmes en mettant en œuvre des mécanismes de surveillance, de journalisation et d’alerte.
- Assurez-vous que la charge de travail peut évoluer pour gérer des charges variables, ce qui est particulièrement important pour les charges de travail d’IA qui peuvent avoir des demandes fluctuantes.
- Mettre en œuvre des mécanismes robustes de gestion des erreurs et de récupération. Configurez des alertes automatisées en cas de panne du système et établissez un plan clair pour une récupération rapide.
- Validez l’architecture cible et l’échelle en comprenant les volumes cibles de messages de chat ou de conversations. Les volumes cibles aident également à valider les aspects de licence de l’application intelligente et l’effet potentiel sur le stockage des transcriptions de conversation. Dataverse
Pour les applications intelligentes qui utilisent des capacités d’IA générative, tenez compte non seulement de la résilience et de la disponibilité, mais également de la fiabilité et de la précision des réponses fournies par la charge de travail intelligente. Tenez compte des recommandations suivantes pour chaque considération de conception :
- Optimisez la génération augmentée de récupération (RAG) : assurez-vous que vos données sont propres et bien structurées, créez des intégrations et des index efficaces pour une récupération rapide et implémentez des mécanismes de surveillance et de rétroaction robustes pour améliorer en permanence les performances de la charge de travail.
- Des invites efficaces :Concevez des invites précises et contextuellement pertinentes pour aider l’IA à produire des réponses précises.
- Évaluation régulière :Mettre en œuvre une surveillance et des tests continus des résultats de l’IA pour évaluer l’exactitude, la pertinence et le respect de l’éthique.
- Boucles de rétroaction : Établir des mécanismes de rétroaction où les utilisateurs peuvent signaler des inexactitudes, qui peuvent ensuite être utilisées pour affiner et améliorer les modèles. Microsoft Copilot Studio fournit analyse de la satisfaction client, qui fournissent des informations exploitables sur les facteurs de satisfaction ou d’insatisfaction à l’égard des réponses de votre copilote.
- Formations spécifiques au domaine :Affiner les modèles sur des données spécifiques à un domaine pour améliorer la précision dans des contextes spécifiques.
- Mises à jour régulières :Mettre à jour périodiquement les modèles avec de nouvelles données pour maintenir leur pertinence et leur exactitude.
- Intentions non reconnues : gérez les intentions non reconnues en utilisant des réponses génératives pour trouver des réponses à partir des sources de données disponibles et en utilisant le rubrique de base pour intégrer d’autres systèmes.
Sécurité
Dans un modèle de responsabilité partagée :
- Les organisations sont principalement responsables de la gestion et de l’exploitation des charges de travail.
- Microsoft gère la sécurité de l’infrastructure sous-jacente, y compris les centres de données, la sécurité du réseau, les mesures de sécurité physique et les fonctionnalités de sécurité intégrées telles que le cryptage, la gestion des identités et la conformité aux normes de l’industrie. En savoir plus sur Sécurité dans Microsoft Power Platform et Copilot Studio Sécurité et gouvernance.
Nous vous recommandons d’évaluer régulièrement les services et les technologies pour garantir que votre posture de sécurité s’adapte à l’évolution du paysage des menaces. Établir une compréhension claire du modèle de responsabilité partagée avec les fournisseurs est essentiel lors de la collaboration pour mettre en œuvre des mesures de sécurité.
Vous pouvez utiliser plusieurs méthodes pour sécuriser vos charges de travail d’application intelligentes :
- Authentification des utilisateurs et contrôle d’accès : mettez en œuvre des mesures d’authentification et de contrôle d’accès robustes pour garantir que seuls les utilisateurs autorisés peuvent accéder à la charge de travail de l’application intelligente. L’accès non autorisé à la charge de travail de l’application intelligente peut entraîner des violations de données, une mauvaise utilisation des ressources et une exposition potentielle d’informations sensibles. Des mécanismes d’authentification faibles ou inefficaces peuvent également entraîner la compromission de comptes utilisateurs.
- Conformité : garantir que les données sont protégées et gérées conformément aux exigences réglementaires. Comprenez les réglementations locales, restez informé des lois locales sur la protection des données et assurez-vous que votre stratégie de résidence des données est conforme à ces réglementations.
- Intégration : sécurisez toutes les intégrations avec les principaux de service. Surveillez et protéger l’intégrité du réseau des points de terminaison internes et externes grâce à des fonctionnalités et des dispositifs de sécurité, tels que des pare-feu ou des pare-feu d’applications Web.
- Surveillance et audit continus : Surveillez et auditez en continu les activités des charges de travail pour détecter et réagir de manière proactive.
- Outils de sécurité Azure : utilisez les outils de sécurité intégrés d’Azure, tels que Microsoft Defender for Cloud et Azure Policy, pour surveiller et appliquer les stratégies de sécurité.
- Formation des employés : Formez les employés aux meilleures pratiques en matière de protection des données et à l’importance de respecter les exigences en matière de résidence des données.
Efficacité en termes de performance
L’efficacité des performances est la capacité de votre charge de travail à évoluer efficacement pour répondre aux demandes des utilisateurs.
Augmentez l’efficacité des performances en :
- Comprendre les volumes cibles pour valider l’architecture et l’échelle cibles. Les volumes cibles aident également à valider les aspects de licence du copilote et l’effet potentiel sur le stockage des transcriptions de conversation. Dataverse
- Comprendre les limites de la plateforme. Lorsque vous intégrez votre charge de travail d’application intelligente à des systèmes externes, par exemple via des requêtes HTTP ou HTTP, il est important de valider que chaque composant peut gérer la charge. Power Automate
- Surveillance continue des performances et détection des anomalies à l’aide d’outils tels qu’Azure Monitor, Log Analytics et des alertes. Application Insights
- Comprendre les temps attendus de réponse pour :
- Premier chargement du chat et premier message réponse
- Latence maximale pour que le copilote réponde aux requêtes des utilisateurs
- Approche pour gérer les actions de longue durée (par exemple, attendre qu’un système externe renvoie des données)
- Optimiser le taux de déviation, ou le taux auquel les demandes sont traitées en libre-service grâce à l’automatisation (réduction du nombre de demandes nécessitant une assistance conseiller). En savoir plus sur Optimisation des performances pour les charges de travail d’application intelligentes.
Prendre en compte chacun de ces aspects vous aide à créer une charge de travail d’application intelligente avec une expérience utilisateur cohérente et homogène.
Excellence opérationnelle
L’excellence opérationnelle implique le développement de processus efficaces pour prendre en charge votre charge de travail d’application intelligente.
Les défaillances opérationnelles peuvent également affecter d’autres domaines de conception ainsi que le succès global de la charge de travail de l’application intelligente. Il est important d’adapter vos processus opérationnels pour prendre en charge une charge de travail d’application intelligente en production. Les recommandations suivantes favorisent l’excellence opérationnelle :
- Automatisez les processus de création et de publication. Les processus de création et de publication entièrement automatisés réduisent les frictions et augmentent la vitesse du déploiement des mises à jour, apportant répétabilité et cohérence entre les environnements. L’automatisation raccourcit le Boucle de rétroaction, des développeurs qui poussent les changements à l’obtention d’informations sur la qualité du code, la couverture des tests, la résilience, la sécurité et les performances, qui contribuent tous à la productivité des développeurs.
- Maintenir la gouvernance et la conformité.
- Analysez les performances et la santé de votre environnement en production.
- Maintenir une documentation qui capture :
- Procédures de dépannage
- Plans de reprise après sinistre
- Fournir des conseils de remédiation sur la façon d’accélérer le processus de résolution des problèmes.
- Adopter une amélioration opérationnelle continue. Donner la priorité à l’amélioration de routine du système et de l’expérience utilisateur. Utilisez un modèle de santé pour comprendre et mesurer l’efficacité opérationnelle, ainsi que des mécanismes de rétroaction pour permettre aux équipes d’application de comprendre et de combler les lacunes de manière itérative.
Ces recommandations peuvent aider votre équipe à collaborer de manière efficace et transparente.
Optimisation de l’expérience
Une charge de travail d’application intelligente doit donner la priorité à la conception des conversations pour garantir une expérience conviviale qui permet aux utilisateurs d’atteindre leurs objectifs avec un minimum d’effort. La conception doit aborder des sujets que l’IA générative ne peut pas gérer et inclure des mécanismes de secours. Mettre également en œuvre des mécanismes permettant de recueillir les commentaires des utilisateurs et d’affiner en permanence les modèles d’IA et la charge de travail en fonction de ces commentaires.
L’optimisation de l’expérience utilisateur pour une charge de travail d’application intelligente implique plusieurs considérations clés :
Conception de conversation :Concevez des conversations intuitives et faciles à parcourir. Utilisez un langage clair et concis et assurez-vous que l’IA peut gérer efficacement les requêtes courantes des utilisateurs. Concentrez-vous sur l’aide aux utilisateurs pour atteindre leurs objectifs avec un minimum d’effort. Comprenez les intentions des utilisateurs et fournissez rapidement des réponses pertinentes pour garantir une expérience utilisateur fluide et efficace.
Limitations de gestion : implémentez des mécanismes de secours pour les sujets que l’IA générative ne peut pas gérer, tels que la redirection des utilisateurs vers des agents humains ou la fourniture de ressources alternatives. Concevez des processus de gestion des erreurs robustes pour gérer les entrées inattendues avec élégance. Informez les utilisateurs lorsque l’IA n’est pas en mesure de traiter leur demande et proposez des alternatives.
Commentaires des utilisateurs : intégrez des mécanismes pour recueillir en continu les commentaires des utilisateurs. Microsoft Copilot Studio fournit des analyses de satisfaction client qui fournissent des informations exploitables sur les facteurs de satisfaction ou d’insatisfaction concernant les réponses de votre copilote. Utilisez les commentaires recueillis pour affiner et améliorer les modèles d’IA et la charge de travail globale. Des mises à jour régulières basées sur les contributions des utilisateurs peuvent considérablement améliorer l’expérience utilisateur.
Personnalisation et personnalisation : personnalisez les invites et les instructions de aligner en fonction de vos cas d’utilisation spécifiques et des besoins des utilisateurs, afin de garantir des réponses plus précises et pertinentes. Utilisez chaînage dynamique pour automatiser les déclencheurs et gérer efficacement les flux rubrique afin de réduire le besoin de sujets prédéfinis manuellement et d’améliorer la capacité de l’IA à reconnaître l’intention de l’utilisateur. En savoir plus dans Optimiser les invites et la configuration rubrique.
Étapes suivantes
Les principes de conception du Well-Architected Framework sont intégrés dans les domaines de conception de charge de travail d’application intelligente. Chaque zone de conception fournit des conseils ciblés pour vous aider à accéder rapidement aux informations dont vous avez besoin pour améliorer efficacement votre productivité.
Commencez par examiner les considérations de conception nécessaires pour prendre en charge une charge de travail :