Partager via


Optimisation des performances pour les charges de travail d’applications intelligentes

L’efficacité des performances est la capacité de votre charge de travail à évoluer efficacement pour répondre aux exigences des utilisateurs. La surveillance des performances de la charge de travail de votre application intelligente est cruciale pour garantir son fonctionnement efficace et efficient.

L’équipe chargée de la charge de travail doit établir des indicateurs de performance clés, examiner régulièrement les performances du système et diagnostiquer rapidement tout problème. Des procédures de surveillance et de diagnostic efficaces permettent de maintenir la fiabilité du système et la satisfaction des utilisateurs.

Définir les objectifs de performances

L’identification des indicateurs de performance clés implique de déterminer les mesures essentielles qui permettent de suivre les progrès vers l’atteinte des objectifs de performance de la charge de travail. Ces mesures fournissent un moyen quantifiable de mesurer et d’améliorer l’efficacité des performances.

Lorsque vous identifiez les indicateurs clés sur lesquels vous devez vous concentrer, tenez compte des indicateurs liés à la capacité, au temps de réponse, au taux de déviation, à l’engagement et aux résultats :

  • Capacité : le débit et la simultanéité sont des exemples de mesures de capacité. Le débit fait référence à la capacité de traiter un nombre spécifique de transactions sur une période donnée. Par exemple, un agent peut gérer 200 000 sessions de conversation instantanée par mois. Tenez également compte des variations saisonnières et du pic maximal prévu de conversations simultanées. La simultanéité est une mesure d’utilisateurs ou d’actions simultanés. Par exemple, un agent peut gérer un maximum de 5 000 conversations simultanées pendant la haute saison. Comprendre les volumes cibles permet de valider l’architecture et l’échelle cibles.

  • Temps de réponse : la latence et le temps de chargement sont des mesures de temps de réponse courantes. La latence est le temps nécessaire pour répondre à une demande (200 millisecondes). Le temps de chargement est le temps nécessaire à un agent pour devenir actif et répondre au premier message. Comprenez la latence maximale attendue pour permettre à l’agent de répondre aux requêtes et définissez une approche pour gérer les actions de longue durée (par exemple, attendre qu’un système externe renvoie des données).

  • Taux de déviation : dans le contexte de l’IA conversationnelle, la déviation est un indicateur représentant le pourcentage de demandes effectuées en libre-service qui seraient autrement traitées par les conseillers du service clientèle. En d’autres termes, il s’agit du nombre de tâches qu’une équipe n’a plus à gérer en raison de l’automatisation. L’optimisation du taux de déviation de l’agent est l’un des principaux domaines cibles permettant aux organisations d’atteindre leurs objectifs commerciaux, depuis le retour sur investissement (ROI) et la satisfaction client (CSAT) à l’amélioration des performances globales de l’agent. Microsoft Copilot Studio fournit une vue d’ensemble des performances de votre agent, y compris des indicateurs clés tels que le taux de résolution, le taux d’escalade et le CSAT.

  • Engagement et résultats : le suivi de l’engagement et des résultats des conversations est essentiel pour mesurer les indicateurs de performance de l’agent et identifier les domaines à améliorer. Pour en savoir plus, consultez Mesure de l’engagement de l’agent et Mesure des résultats de l’agent.

Planification des performances

Les ressources de votre charge de travail ont des limitations de performances. Des limitations de performances s’appliquent aux fonctionnalités de chaque service. Vous devez comprendre les limitations des ressources de votre charge de travail et prendre en compte ces limitations dans vos décisions de conception. Par exemple, vous devez savoir si les limitations de ressources nécessitent de modifier l’approche de conception ou de modifier complètement les ressources.

  • Comprendre les volumes cibles. Les volumes cibles aident à valider l’architecture et l’échelle cibles, les aspects de licence de l’agent et l’effet potentiel sur le stockage Dataverse pour les transcriptions de conversation.
  • Comprenez les limites de la plateforme. Lors de l’intégration de la charge de travail de votre application intelligente à des systèmes externes, par exemple par le biais de Power Automate ou de requêtes HTTP, il est important de valider que chaque composant peut gérer la charge.
  • Identifiez les goulots d’étranglement. Mesurez le débit et les temps de réponse pour identifier les composants de votre système qui pourraient devenir problématiques à mesure que la charge de travail augmente. Identifiez les goulots d’étranglement dans le processus de bout en bout à l’aide de fonctionnalités d’analyse de l’exploration de processus telles que les retouches et l’analyse des causes profondes.

Pour en savoir plus, voir Recommandations pour la planification des performances

Monitoring des performances

L’optimisation des performances nécessite des données pour mesurer les performances actuelles d’une charge de travail ou d’un flux par rapport à ses objectifs de performances. Collectez une quantité et une variété suffisantes de données pour mesurer avec précision les performances du code et de l’infrastructure par rapport aux objectifs de performance définis. Assurez-vous que chaque composant et flux au sein de la charge de travail génère automatiquement des mesures et des journaux continus et significatifs.

Surveillez avec vigilance les performances de la charge de travail de votre application intelligente pour vous assurer qu’elle fonctionne de manière optimale.

Copilot Studio fournit des analyses prêtes à l’emploi complètes qui vous permettent de comprendre l’utilisation et les indicateurs de performance clés d’un agent.

Vous pouvez afficher les rapports relatifs à :

  • Performances et utilisation
  • Satisfaction client
  • Informations sur la session
  • Utilisation des rubriques
  • Sessions facturées

En plus des fonctionnalités d’analyse natives de Copilot Studio, vous pouvez envoyer des données de télémétrie à Application Insights. Pour en savoir plus, consultez Capturer la télémétrie avec Application Insights. Surveillez en permanence les performances et détectez les anomalies à l’aide d’outils tels qu’Azure Monitor, Log Analytics, Application Insights et les alertes.

Définissez les indicateurs de performance clés (KPI) que vous avez l’intention de surveiller pour mesurer le succès de la charge de travail de votre application intelligente, tels que le taux d’engagement, le taux de résolution et le taux de déviation. Tout d’abord, passez en revue les tableaux de bord natifs pour comprendre les données disponibles. Ensuite, décidez si la création d’un rapport personnalisé répondrait mieux à vos besoins spécifiques.

En savoir plus :

Optimisation continue des performances

L’optimisation proactive des performances implique la mise en œuvre de mesures visant à améliorer et à renforcer les performances de la charge de travail avant que des problèmes ne surviennent. Les mesures proactives incluent l’identification des goulots d’étranglement potentiels, la surveillance des mesures de performance et la mise en œuvre d’optimisations pour garantir que la charge de travail s’exécute efficacement et atteint les objectifs de performances.

Pour améliorer en permanence la charge de travail de votre application intelligente, planifiez des analyses régulières des performances de l’agent :

Indicateur de performance Définition
Taux de résolution Pourcentage de demandes des utilisateurs résolues avec succès par l’agent sans nécessiter d’escalade à un conseiller du service clientèle.
Taux d’engagement Pourcentage du nombre total de sessions engagées. Une session est considérée comme engagée lorsqu’un utilisateur interagit avec l’agent de manière significative, par exemple en déclenchant une rubrique hors système, en escaladant la session ou en appelant une rubrique de secours.
Taux d’abandon Pourcentage de sessions engagées qui se terminent sans parvenir à une résolution ou à une escalade. En substance, il mesure la fréquence à laquelle les utilisateurs quittent ou cessent d’interagir avec l’agent avant que leur problème ne soit résolu ou transmis à un conseiller.
Taux d’escalade Pourcentage de sessions engagées escaladées à un conseiller. Cette mesure est essentielle pour comprendre à quelle fréquence l’agent est incapable de résoudre les requêtes des utilisateurs par lui-même et nécessite une intervention humaine.
Énoncés non reconnus Se produit lorsque le modèle de compréhension du langage naturel (CLN) de l’agent ne peut pas associer une entrée utilisateur à une intention ou à une rubrique prédéfinie. Le système n’est pas en mesure de déterminer l’intention de l’utilisateur en fonction de l’entrée fournie.
CSAT La satisfaction client.
Rubriques à faible résolution Fait référence à des rubriques de conversation qui échouent souvent à résoudre efficacement les requêtes des utilisateurs. Ces rubriques génèrent souvent l’insatisfaction, l’abandon ou l’escalade de l’utilisateur à un conseiller.

Cette révision aide à hiérarchiser le backlog des mises à jour de l’agent. Par exemple, si des énoncés non reconnus sont fréquemment escaladés à un conseiller du service clientèle, saisissez l’opportunité pour améliorer la déviation. Analysez les modèles utilisateur qui déclenchent des rubriques de secours ou des énoncés non reconnus, et entraînez les rubriques existantes ou créez-en de nouvelles pour permettre à l’agent de mieux répondre aux besoins des utilisateurs.

En savoir plus :