Partager via


Optimisation des performances pour les charges de travail des applications intelligentes

L’efficacité des performances est la capacité de votre charge de travail à évoluer efficacement pour répondre aux demandes des utilisateurs. La surveillance des performances de votre charge de travail d’application intelligente est essentielle pour garantir son fonctionnement efficace et efficient.

L’équipe de charge de travail doit établir des indicateurs de performance clés, examiner régulièrement les performances du système et diagnostiquer rapidement tout problème. Des procédures de surveillance et de diagnostic efficaces contribuent à maintenir la fiabilité du système et la satisfaction des utilisateurs.

Définir des objectifs de performance

L’identification des indicateurs de performance clés implique la détermination des mesures essentielles qui suivent la progression vers la réalisation des objectifs de performance de la charge de travail. Ces mesures fournissent un moyen quantifiable de mesurer et d’améliorer l’efficacité des performances.

Lorsque vous identifiez les indicateurs clés sur lesquels vous concentrer, tenez compte des indicateurs liés à la capacité, au temps, au taux de déviation, à l’engagement et aux résultats :

  • Capacité : Le débit et la concurrence sont des exemples de mesures de capacité. Le débit fait référence à la capacité à gérer un nombre spécifique de transactions dans une période donnée. Par exemple, un copilote peut gérer 200 000 sessions de chat par mois. Tenez également compte des variations saisonnières et du pic maximal prévu de conversations simultanées. La concurrence est une mesure du nombre d’utilisateurs ou d’actions simultanés. Par exemple, un copilote peut gérer un maximum de 5 000 conversations simultanées pendant la haute saison. La compréhension des volumes cibles permet de valider l’architecture et l’évolutivité cibles.

  • réponse temps : la latence et le temps de chargement sont des mesures de temps réponse courantes. La latence est le temps qu’il faut pour répondre à une requête (200 millisecondes). Le temps de chargement est le temps qu’il faut à un copilote pour devenir actif et répondre au premier message. Comprendre la latence maximale attendue pour que le copilote réponde aux requêtes et définir une approche pour gérer les actions de longue durée (par exemple, attendre qu’un système externe renvoie des données).

  • Taux de déviation : dans le contexte de l’IA conversationnelle, la déviation est un indicateur représentant le pourcentage de demandes traitées en libre-service qui seraient autrement traitées par des agents en direct. En d’autres termes, il s’agit du nombre de tâches qu’une équipe n’a plus à gérer grâce à l’automatisation. L’optimisation du taux de déviation du copilote est l’un des principaux domaines d’intérêt des organisations pour atteindre leurs objectifs commerciaux, du retour sur investissement (ROI) et de la satisfaction client (CSAT) à l’amélioration des performances globales du copilote. Copilot Studio fournit un aperçu des performances de votre copilote, y compris des indicateurs clés tels que le taux de résolution, le taux d’escalade et le CSAT.

  • Engagement et résultats : Le suivi de l’engagement et des résultats des conversations est essentiel pour mesurer les indicateurs de performance du copilote et identifier les domaines à améliorer. Pour en savoir plus, consultez Mesurer l’engagement du copilote et Mesurer les résultats du copilote.

Planification des performances

Les ressources de votre charge de travail ont des limitations de performances. Des limitations de performances s’appliquent aux fonctionnalités de chaque service. Vous devez comprendre les limitations des ressources de votre charge de travail et prendre en compte ces limitations dans vos décisions de conception. Par exemple, vous devez savoir si les limitations de ressources nécessitent de modifier l’approche de conception ou de modifier complètement les ressources.

  • Comprendre les volumes cibles. Les volumes cibles aident à valider l’architecture et l’échelle cibles, les aspects de licence du copilote et l’effet potentiel sur le stockage des transcriptions de conversation. Dataverse
  • Comprendre les limites de la plateforme. Lors de l’intégration de votre charge de travail d’application intelligente avec des systèmes externes, par exemple via des requêtes HTTP ou HTTP, il est important de valider que chaque composant peut gérer la charge. Power Automate
  • Identifier les goulots d’étranglement. Mesurez le débit et les temps réponse pour identifier les composants de votre système qui pourraient devenir problématiques à mesure que la charge de travail augmente. Identifiez les goulots d’étranglement dans le processus de bout en bout en utilisant des fonctionnalités d’analyse de processus telles que la reprise et l’analyse des causes profondes.

En savoir plus : Recommandations pour la planification des performances

Monitoring des performances

L’optimisation des performances nécessite des données pour mesurer les performances actuelles d’une charge de travail ou d’un flux par rapport à ses objectifs de performances. Collectez une quantité et une variété de données suffisantes pour mesurer avec précision les performances du code et de l’infrastructure par rapport aux objectifs de performance définis. Assurez-vous que chaque composant et flux au sein de la charge de travail génère automatiquement des mesures et des journaux continus et significatifs.

Surveillez attentivement les performances de votre charge de travail d’application intelligente pour garantir qu’elle fonctionne avec une efficacité et une efficience maximales.

Copilot Studio fournit des analyses complètes et prêtes à l’emploi qui vous permettent de comprendre l’utilisation et les indicateurs de performance clés d’un copilote. ...

Vous pouvez consulter les rapports relatifs à :

  • Performances et utilisation
  • Satisfaction client
  • Informations sur la session
  • Utilisation des rubriques
  • Sessions facturées

En plus des fonctionnalités d’analyse natives de Copilot Studio, vous pouvez envoyer des données de télémétrie à Application Insights. En savoir plus sur Capturer la télémétrie avec Application Insights. Surveillez en continu les performances et détectez les anomalies à l’aide d’outils tels qu’Azure Monitor, Log Analytics et des alertes. Application Insights

Définissez les indicateurs de performance clés (KPI) que vous souhaitez surveiller pour mesurer le succès de votre charge de travail d’application intelligente, tels que le taux d’engagement, le taux de résolution et le taux de déviation. Tout d’abord, examinez les tableaux de bord natifs pour comprendre les données disponibles. Ensuite, décidez si la création d’un rapport personnalisé répondrait mieux à vos besoins spécifiques.

En savoir plus :

Optimisation continue des performances

L’optimisation proactive des performances implique la mise en œuvre de mesures visant à améliorer et à renforcer les performances de la charge de travail avant que des problèmes ne surviennent. Les mesures proactives incluent l’identification des goulots d’étranglement potentiels, la surveillance des mesures de performance et la mise en œuvre d’optimisations pour garantir que la charge de travail s’exécute efficacement et atteint les objectifs de performance.

Pour améliorer en permanence la charge de travail de votre application intelligente, planifiez des évaluations régulières des performances du copilote :

Indicateur de performance Définition
Taux de résolution Pourcentage de demandes d’utilisateurs résolues avec succès par le copilote sans nécessiter de recours à un agent humain.
Taux d’engagement Pourcentage du total des sessions engagées. Une session est considérée comme engagée lorsqu’un utilisateur interagit avec le copilote de manière significative, par exemple en déclenchant un rubrique non système, en faisant évoluer la session ou en invoquant un Gâchette.
Taux d’abandon Pourcentage de sessions engagées qui se terminent sans parvenir à une résolution ou à une escalade. Essentiellement, il mesure la fréquence à laquelle les utilisateurs quittent ou cessent d’interagir avec le copilote avant que leur problème ne soit résolu ou transmis à un agent humain.
Taux d’escalade Pourcentage de sessions engagées qui sont transmises à un agent humain. Cette mesure est essentielle pour comprendre à quelle fréquence le copilote est incapable de résoudre seul les requêtes des utilisateurs et nécessite une intervention humaine.
Des paroles non reconnues Se produit lorsque le modèle compréhension du langage naturel (CLN) du copilote ne peut pas faire correspondre une entrée utilisateur à une intention prédéfinie ou rubrique. Le système n’est pas en mesure de déterminer l’intention de l’utilisateur en fonction des données fournies.
CSAT La satisfaction client.
Sujets à faible résolution Fait référence aux sujets de conversation qui ne parviennent souvent pas à résoudre efficacement les requêtes des utilisateurs. Ces sujets conduisent souvent à l’insatisfaction des utilisateurs, à leur abandon ou à leur recours à des agents humains.

Cette revue permet de prioriser l’arriéré des mises à jour du copilote. Par exemple, si des énoncés non reconnus sont fréquemment transmis à un agent humain, profitez-en pour améliorer la déviation. Analysez les modèles d’utilisateurs qui renvoient des énoncés de secours et non reconnus, et formez les sujets existants ou créez-en de nouveaux pour équiper le copilote afin de mieux répondre aux besoins des utilisateurs.

En savoir plus :