Utilisation d’événements à l’aide des diagnostics d’application
L’utilisation des alertes est une partie standard de l’utilisation de System Center - Operations Manager. Les alertes pour la surveillance des applications .NET vous montrent les informations que vous allez reconnaître à partir d’autres alertes, telles que les informations générales et les connaissances sur les produits. Cependant, une alerte d'application .NET fournit également un lien dans la description de l'alerte. Ce lien ouvre l'événement qui a déclenché l'alerte dans Application Diagnostics. Vous trouverez ici de nombreuses informations supplémentaires qui vous aideront à identifier et résoudre votre problème.
Remarque
Une résolution en profondeur des problèmes d'alertes en provenance de l'analyse des performances des applications requiert souvent l'accès au code source des applications et peut nécessiter l'intervention de développeurs. Vous pouvez installer le pack d'administration de synchronisation des éléments de travail de Team Foundation Server et transmettre des alertes au Team Foundation Server utilisé par l'équipe de développement. Le pack d'administration de synchronisation des éléments de travail de Team Foundation Server effectue le suivi et la synchronisation des modifications apportées aux éléments de travail de Team Foundation Server, ainsi que des modifications apportées aux alertes Operations Manager associées.
Examen des alertes d’application .NET
La diminution du temps nécessaire pour déterminer, affecter et résoudre les problèmes est l’objectif central de la surveillance des applications dans Operations Manager. Lorsque vous recevez une alerte, vous devez savoir ce qui l’a provoqué - le système hébergeant l’application ou le code, être en mesure d’afficher les données à sauvegarder cette conclusion et de voir clairement qui doit résoudre le problème. Pour savoir s’il s’agit d’un problème système, vous devez connaître l’état de votre système au moment de l’événement. Pour savoir où le problème racine s'est produit, vous devez connaître la chaîne d'appels qui s'est produite. Pour examiner plus en détail, vous devez comparer des événements similaires et des événements connexes qui se sont produits en même temps. Les détails de l'événement, les compteurs de performances et les chaînes distribuées vous permettront de déterminer à qui doit être adressé ce problème en premier. S’il s’agit d’une erreur système, vous pouvez ajuster les ressources disponibles ou la configuration du système hôte et résoudre le problème au niveau de l’hôte. S’il s’agit d’un échec d’application, le problème doit être lié à l’équipe de l’application, ainsi qu’à la ligne de code où l’échec s’est produit. Voici certaines stratégies pour utiliser les affichages, filtres et paramètres d'Application Diagnostics qui vous aideront à identifier l'origine du problème, à trouver une solution et à mieux savoir qui est concerné par la résolution du problème.
Ouvrir Diagnostics d’application à partir d’une alerte
Étant donné que vous répondez aux alertes liées à des groupes d’applications spécifiques que vous avez configurés, il est utile d’étendre les alertes actives et de les afficher par groupe d’applications. Dans la console Opérateur, dans le volet de navigation, sélectionnez Surveillance, développez Application Monitoring.NET Surveillance, sélectionnez le dossier portant le nom du groupe d’applications que vous avez configuré pour la surveillance dont vous souhaitez examiner les alertes, puis sélectionnez Alertes actives.
Double-cliquez sur l'alerte que vous souhaitez ouvrir.
Dans la page Propriétés de l’alerte, sélectionnez le lien dans le volet Description de l’alerte. Cela ouvre Les diagnostics d’application, une nouvelle fonctionnalité de supervision dans Operations Manager dans un navigateur web. Ici, sous l’onglet Propriétés d’événement, vous pouvez voir des informations, telles que les métriques de performances, la pile des appels et les notes de collecte relatives à l’alerte. Dans les onglets, vous pouvez voir les événements similaires et connexes, les chaînes d'événements et les compteurs de performances. Il s'agit d'informations détaillées sur l'événement d'exception ou de performances déclenché pour l'application qui vous aidera à identifier si le problème vient de l'application elle-même, d'un appel à un service Web ou d'un appel à une base de données. Pour plus d'informations sur l'onglet Propriétés de l'événement, consultez Détails de l'événement de performances. Sélectionnez Oui pour fermer la fenêtre principale une fois que les informations sur l’événement ont été chargées.
Remarque
Ce lien vers Application Diagnostics se trouve également dans l'onglet Contexte de l'alerte .
Utilisez les procédures suivantes pour examiner votre alerte. Les professionnels de l'informatique souhaiteront probablement utiliser les informations des onglets Propriétés de l'événement, Compteurs de performance et Chaînes distribuées pour découvrir ce qui est arrivé, comprendre si un problème système a déclenché l'alerte et déterminer l'origine du problème. Les développeurs souhaiteront probablement utiliser les informations des onglets Chaînes distribuées, Événements similaires et Événements connexes pour comprendre le contexte spécifique dans lequel s'est produit un problème de code.
Résoudre les problèmes à l’aide des propriétés d’événement d’exception dans Diagnostics d’application
Dans la fenêtre Diagnostics d’application pour l’alerte d’exception que vous examinez, sélectionnez l’onglet Propriétés d’événement pour afficher les détails clés de l’alerte. Cet onglet est à consulter en priorité pour vérifier si le problème d'alerte est visible. Voici quelques-unes des principales catégories d’informations que vous verrez dans la page propriétés de l’événement :
Source Pour afficher le chargement et les temps de réponse de l’application, sélectionnez le lien Source dans le coin supérieur gauche. Ces informations présentent la charge à laquelle le système était soumis lors de la défaillance de l'événement d'exception. Pour afficher les compteurs de performances et évaluer davantage l’état du système, dans la page Source, sélectionnez l’onglet Rapports de tendances . Pour voir les ordinateurs sur lesquels cette application fonctionne et voir s’il peut y avoir un problème d’équilibrage de charge entre les ordinateurs, sélectionnez l’onglet Ordinateurs . Pour afficher la répartition des appels associés ou l’endroit où les événements se produisent en fonction de chaînes, sélectionnez l’onglet Topologie .
Chaîne d'exception Cette catégorie s'affiche pour les événements d'exception. Développez Chaîne d'exception pour afficher l'exception réelle qui s'est produite.
Données d'exception Cette catégorie s'affiche pour les événements d'exception et présente les paramètres et variables définis pour la classe par le biais de l'exception.
Pile Il s'agit de la pile des appels ou de l'ordre dans lequel les événements se sont produits. L'arborescence d'exécution vous permet de développer les nœuds pour examiner les appels. Sélectionnez la case d’option Affichage du groupe de ressources pour afficher une vue d’ensemble de l’endroit où le temps a été passé. Cela permet de situer le niveau du problème ou son emplacement.
La liste des modules s’affiche pour les événements d’exception et affiche les modules chargés au moment de l’exception.
Remarques sur la collection Cette catégorie affiche toutes les remarques relatives à l'événement.
Conseil
Utilisez les mêmes étapes de résolution des problèmes pour les événements de performances, les événements similaires, les événements connexes, les chaînes distribuées et les compteurs de performances que pour les événements d'exception.
Résoudre les problèmes à l’aide des propriétés d’événement de performances dans Diagnostics d’application
Dans la fenêtre Diagnostics d’application pour l’alerte de performances que vous examinez, sélectionnez l’onglet Propriétés d’événement pour afficher les détails clés de l’alerte. Cet onglet est à consulter en priorité pour vérifier si le problème d'alerte est visible. Voici quelques-unes des principales catégories d’informations que vous verrez dans la page Propriétés des performances :
Source Pour afficher le chargement et les temps de réponse de l’application, sélectionnez le lien Source dans le coin supérieur gauche. Ces informations présentent la charge à laquelle le système était soumis lors de la défaillance de l'événement d'exception. Pour afficher les compteurs de performances et évaluer davantage l’état du système, dans la page Source, sélectionnez l’onglet Rapports de tendances . Pour voir les ordinateurs sur lesquels cette application fonctionne et voir s’il peut y avoir un problème d’équilibrage de charge entre les ordinateurs, sélectionnez l’onglet Ordinateurs . Pour afficher la répartition des appels associés ou l’endroit où les événements se produisent en fonction de chaînes, sélectionnez l’onglet Topologie .
Nœuds les plus lents Cette catégorie répertorie les nœuds les plus lents dans l'arborescence d'exécution et la cause la plus probable des problèmes de performances dans l'application.
Pile Il s'agit de la pile des appels ou de l'ordre dans lequel les événements se sont produits. L'arborescence d'exécution vous permet de développer les nœuds pour examiner les appels. Sélectionnez la case d’option Affichage du groupe de ressources pour afficher une vue d’ensemble de l’endroit où le temps a été passé. Cela permet de situer le niveau du problème et son emplacement.
Remarques sur la collection Cette catégorie affiche toutes les remarques relatives à l'événement.
Résoudre les problèmes d’état du système à l’aide des compteurs de performances
Pour afficher une table ou un diagramme de compteurs de performances clés, sélectionnez l’onglet Compteurs de performances.
Remarque
Quinze minutes de données de performances sont collectées et mises en cache sur le système analysé. Lorsqu’une performance ou une exception est levée, les données de performances sont renvoyées à Operations Manager avec l’événement.
Cochez les cases du compteur de performances pour les compteurs de performances que vous souhaitez inclure dans vos informations, puis sélectionnez Appliquer.
Utilisez les informations de cet affichage pour évaluer l’état des performances du système autour de l’événement que vous examinez. Par exemple, si les performances sont uniformément lentes au moment de l'événement, votre alerte est probablement due à un problème de performances du système.
Rechercher le problème racine à l’aide de chaînes distribuées
Sélectionnez l’onglet Chaînes distribuées pour afficher l’ordre des appels, chaîne d’événements dont l’événement fait partie. Cela vous aide à comprendre comment l’événement que vous examinez a été affecté par d’autres événements de l’application ou des applications associées.
Dans la vue Chaînes distribuées, sélectionnez l’un des appels ou liens dans la chaîne. S'il existe plusieurs événements pour un même objet, l'Assistant Chaînage s'ouvre. Cet Assistant vous permet de sélectionner les événements possibles à mettre en corrélation dans une chaîne d'événements. Pour commencer l’Assistant, sélectionnez Suivant.
Remarque
Obtenez l’horodatage à partir de l’appel que vous sélectionnez, car vous l’associerez à un événement sur la page suivante.
Dans la page Sélectionner un événement de chaîne possible, sélectionnez l’événement que vous souhaitez examiner. Dans l’idéal, il s’agit de l’événement avec l’horodatage le plus proche de l’appel que vous avez sélectionné dans la vue Chaînes distribuées.
Ce que vous voyez ensuite dépend du type de problème que vous examinez. Par exemple, si vous sélectionnez une transaction où un serveur est introuvable, vous pouvez accéder à la page des propriétés d’événement de cet événement. Elle vous permet de coupler l'erreur du serveur avec l'événement que vous examiniez initialement. Comme il s’agit d’une erreur de serveur, vous savez que le problème n’est pas côté client, mais côté serveur. Vous pouvez voir un graphique de l’événement que vous avez sélectionné et être en mesure de décomposer un événement de performances en termes de temps de chargement de page.
Dans les propriétés d’événement, sélectionnez l’appel côté serveur, puis sélectionnez l’onglet Compteurs de performances pour plus d’informations.
Résoudre les problèmes en affichant des événements similaires
Sélectionnez l’onglet Événements similaires pour voir si des alertes similaires ont été levées plus de fois, ce qui peut signifier qu’il existe un problème avec l’application.
Les événements similaires peuvent être filtrés de différentes façons. Sélectionnez le menu déroulant Similar by pour sélectionner la façon dont vous souhaitez regrouper les événements similaires : par problème, action, classe d’exception ou fonction ayant échoué. Dans les zones de texte De et À , vous pouvez définir la plage de dates des événements similaires que vous souhaitez afficher. Utilisez l’onglet Événements similaires pour afficher si des alertes similaires ont été levées plus de fois, ce qui peut signifier qu’il existe un problème avec l’application.
Filtrage par problème vous montre les événements similaires qui sont du même type. Par exemple, vous pouvez voir tous les événements similaires où la référence d’objet n’est pas définie sur une instance d’un objet. Sélectionnez le bouton Affichage du diagramme, et vous pouvez voir le ratio du nombre total d’événements pour le problème actuel et le nombre total d’événements provenant d’autres problèmes. Ces informations vous offrent un aperçu rapide de l'ampleur du problème rencontré par cet événement particulier. Si un grand nombre des événements similaires actuels ont le même problème, il peut s’agir d’un problème de priorité plus élevée à résoudre, car il aura un impact élevé sur la réduction du nombre d’alertes que vous recevez.
Filtrage par Action regroupe les événements similaires par aspect : sécurité, performances, connectivité et échec d'application. Sélectionnez le bouton Affichage du diagramme, et vous pouvez voir le nombre d’événements similaires par ces catégories d’aspects et voir plus facilement ceux auxquels le problème peut être lié.
Filtrage par classe d'exception regroupe les événements similaires en fonction de la façon dont vous les avez nommés lors de la configuration. Probablement, il s’agit de noms qui vous aideront à identifier le type d’exceptions qu’elles sont, telles que la classe System.NullReferenceException .
Filtrage par fonction d'échec regroupe les événements similaires par la fonction qui émet l'exception. Cela peut signifier qu’il existe un problème avec le point d’entrée.
N’oubliez pas qu’il s’agit de tous les événements similaires( liés par définition) et que ces filtres vous donnent une meilleure idée de la façon dont ils sont liés. Par conséquent, à l’aide des filtres Événements similaires, vous pouvez constater que la plupart de vos événements totaux ont le même problème que l’événement que vous affichez, qu’il s’agit d’un problème de performances, qu’ils appartiennent à une classe d’exception que vous avez configurée, et que la moitié des événements similaires avaient la même fonction ayant échoué. Action : la fonction va au développeur qui doit mettre à jour le code de fonction.
Résoudre les problèmes en affichant les événements associés
Sélectionnez l’onglet Événements associés pour afficher les événements associés par heure. Il s’agit d’exceptions corrélées avec d’autres événements qui peuvent vous donner un aperçu du problème.
Pour afficher les détails de l’événement d’un événement dans la liste, sélectionnez le lien dans la colonne Description .
Dans les événements associés, vous remarquerez peut-être que le temps de réponse est lent pour tous les événements pendant une certaine période. Cela peut indiquer un problème avec le système, et non le code, et ainsi il peut être redirigé vers le professionnel de l’informatique pour une solution.
Étapes suivantes
- Pour savoir comment afficher les alertes et commencer à examiner les problèmes soulevés, passez en revue l’affichage et l’examen des alertes pour les applications .NET.