Partager via


Surveiller un seul cluster Azure Stack HCI version 23H2 avec Insights

S’applique à : Azure Stack HCI, version 23H2

Cet article explique comment utiliser Insights pour surveiller un seul cluster Azure Stack HCI. Pour plusieurs clusters Azure Stack HCI, consultez Surveiller plusieurs clusters Azure Stack HCI avec Insights.

Insights est une fonctionnalité d’Azure Monitor qui vous permet de surveiller rapidement votre cluster Azure Stack HCI. Vous pouvez afficher les métriques clés, l’intégrité et les informations d’utilisation relatives au cluster, aux serveurs, aux machines virtuelles et au stockage.

Prenez quelques instants pour regarder la procédure pas à pas vidéo sur Insights pour Azure Stack HCI :

Avantages

Insights pour Azure Stack HCI offre les avantages suivants :

  • Géré par Azure. Insights est géré par Azure et accessible via le Portail Azure, ce qui garantit qu’il est toujours à jour. Il n’est pas nécessaire de configurer une base de données ou un logiciel spécial.

  • Scalabilité. Insights est capable de charger plus de 400 ensembles d’informations de cluster sur plusieurs abonnements simultanément. Il n’existe aucune limitation sur le cluster, le domaine ou l’emplacement physique.

  • Possibilités de personnalisation. L’expérience d’Insight est basée sur les modèles de classeur Azure Monitor. Cela vous permet de modifier les vues et requêtes, de modifier ou de définir des seuils qui s’alignent sur vos limites spécifiques, puis d’enregistrer ces personnalisations dans un classeur. Vous pouvez ensuite épingler des graphiques dans les classeurs aux tableaux de bord Azure.

Prérequis

Voici les conditions préalables à l’utilisation d’Insights pour Azure Stack HCI :

  • Vous devez avoir accès à un cluster Azure Stack HCI déployé et inscrit.

  • L’identité managée de la ressource Azure doit être activée. Pour plus d’informations, consultez Gestion améliorée activée.

Activer les insights

L’activation d’Insights vous aide à surveiller tous les clusters Azure Stack HCI actuellement associés à l’espace de travail Log Analytics en fournissant des métriques d’intégrité utiles. Insights installe l’agent Azure Monitor et vous aide à configurer des règles de collecte de données (DCR) pour surveiller votre cluster Azure Stack HCI.

Pour activer Insights à grande échelle, consultez Activer Insights pour Azure Stack HCI à grande échelle à l’aide de stratégies Azure.

Procédez comme suit pour activer Insights à partir de la Portail Azure :

  1. Dans le Portail Azure, accédez à votre page de ressources de cluster Azure Stack HCI, puis sélectionnez votre cluster. Sous l’onglet Fonctionnalités, sélectionnez Insights.

    Capture d’écran montrant la vignette Insights.

  2. Dans la page Insights , sélectionnez Prise en main.

    Capture d’écran montrant le bouton Prise en main.

  3. Dans la page de configuration Insights, sélectionnez une DCR existante dans la liste déroulante des règles de collecte de données. Le DCR spécifie les journaux d’événements et les compteurs de performances qui doivent être collectés et les stocke dans un espace de travail Log Analytics. Insights crée une DCR par défaut si elle n’existe pas déjà. Seuls les contrôleurs de domaine activés pour Insights sont inclus.

    Capture d’écran montrant la fenêtre de configuration Insights.

  4. (Facultatif) Vous pouvez également créer une DCR en sélectionnant Créer nouveau dans la page de configuration Insights.

    Important

    Nous vous recommandons vivement de ne pas créer votre propre DCR. La DCR créée par Insights inclut un flux de données spécial requis pour son opération. Vous pouvez modifier cette DCR pour collecter plus de données, telles que les événements Windows et Syslog. Les contrôleurs de domaine créés via l’installation AMA auront un préfixe AzureStackHCI- attaché au nom DCR.

    1. Dans la page Nouvelle règle de collecte de données, spécifiez l’abonnement, le nom DCR et le nom du point de terminaison de collecte de données (DCE). Les contrôleurs de domaine sont utilisés pour accéder au service de configuration afin d’extraire les contrôleurs de domaine associés pour l’agent Azure Monitor. Pour plus d’informations sur DCE, consultez les points de terminaison de collecte de données dans Azure Monitor.

      Remarque

      Si vous utilisez des liens privés sur l’agent, vous devez ajouter des contrôleurs de domaine. Pour plus d’informations sur les paramètres réseau AMA, consultez Définir les paramètres réseau de l’agent Azure Monitor.

      Capture d’écran montrant la fenêtre de règle de collecte de données.

    2. Sélectionnez le bouton Vérifier + Créer.

      Si une DCR n’est pas déjà créée pour le cluster non surveillé, celle-ci est créée avec les compteurs de performances activés et le canal du journal des événements Windows activé.

  5. Passez en revue l’écran final avec un résumé du nom DCR, du nombre de journaux d’événements, des compteurs de performances et du nom de l’espace de travail Log Analytics dans lequel les données sont stockées. Sélectionnez Configurer.

    Capture d’écran montrant le sélecteur de liste déroulante de règle de collecte de données.

    Après avoir sélectionné Configurer, vous êtes redirigé vers la page Extensions , où vous pouvez voir l’état de votre installation de l’agent. En configurant Insights, AMA est automatiquement installé sur tous les nœuds du cluster.

  6. Accédez à votre page de ressources de cluster Azure Stack HCI, puis sélectionnez votre cluster. Insights s’affiche désormais comme configuré sous l’onglet Fonctionnalités :

    Capture d’écran montrant la vignette Insights configurée.

Règles de collecte de données

Lorsque vous activez Insights sur une machine avec l’agent Azure Monitor, vous devez spécifier une DCR à utiliser. Pour plus d’informations sur les contrôleurs de domaine, consultez les règles de collecte de données dans Azure Monitor.

Option Description
Compteurs de performance Spécifie les compteurs de performances de données à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Ces compteurs de performances sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, le classeur Insights utilise cinq compteurs de performances - Memory()\Available Bytes, , Network Interface()\Bytes Total/secProcessor(_Total)\% Processor Time, , RDMA Activity()\RDMA Inbound Bytes/secetRDMA Activity()\RDMA Outbound Bytes/sec
Canal du journal des événements Spécifie les journaux des événements Windows à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Les journaux des événements Windows sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, les données sont collectées via deux canaux de journal des événements Windows : - microsoft-windows-health/operational et microsoft-windows-sddc-management/operational
Espace de travail Log Analytics Espace de travail pour stocker les données. Seuls les espaces de travail avec Insights sont répertoriés.

Canal d’événements

Le Microsoft-windows-sddc-management/operational canal d’événements Windows et Microsoft-windows-health/operational le canal d’événements Windows sont ajoutés à votre espace de travail Log Analytics sous les journaux des événements Windows.

Capture d’écran montrant la fenêtre Ajouter une source de données.

En collectant ces journaux, Insights affiche l’état d’intégrité des serveurs, lecteurs, volumes et machines virtuelles individuels. Par défaut, cinq compteurs de performances sont ajoutés.

Compteurs de performance

Par défaut, cinq compteurs de performances sont ajoutés :

Capture d’écran montrant les compteurs de performances ajoutés.

Le tableau suivant décrit les compteurs de performance supervisés :

Compteurs de performance Description
Mémoire (*)\Octets disponibles Octets disponibles est la quantité de mémoire physique, en octets, immédiatement disponible pour l'allocation à un processus ou pour l'utilisation du système.
Performances Interface réseau(*)\Total des octets/s Vitesse à laquelle les octets sont envoyés et reçus sur chaque carte réseau, y compris les caractères de trame. Total des octets/s est la somme des octets reçus par seconde et des octets envoyés par seconde.
Processor(_Total) % de temps de processeur Temps écoulé en pourcentage que tous les threads de processus a passé à utiliser le processeur pour exécuter des instructions.
Activité RDMA(*)\Octets entrants/s RDMA Taux de données reçues sur RDMA par la carte réseau par seconde.
Activité RDMA(*)\Octets sortants/s RDMA Taux de données envoyés sur RDMA par la carte réseau par seconde.

Après avoir activé Insights, il peut prendre jusqu’à 15 minutes pour collecter les données. Une fois le processus terminé, vous pouvez voir une visualisation complète de l’intégrité de votre cluster à partir du menu Insights dans le volet gauche :

Capture d’écran montrant les visualisations Insight.

Désactiver Insights

Pour désactiver Insights, procédez comme suit :

  1. Sélectionnez Insights sous l'onglet Fonctionnalités.

  2. Sélectionner Désactiver Insights.

    Capture d’écran montrant la fenêtre Désactiver Insights.

Lorsque vous désactivez la fonctionnalité Insights, l’association entre la règle de collecte de données et le cluster est supprimée et les journaux de gestion du service d’intégrité et du SDDC ne sont plus collectés ; toutefois, les données existantes ne sont pas supprimées. Si vous souhaitez supprimer ces données, accédez à votre espace de travail DCR et Log Analytics et supprimez les données manuellement.

Mettre à jour Insights

La vignette Insights affiche un message Nécessite une mise à jour dans les cas suivants :

  • Une règle de collecte de données est modifiée.
  • Un événement d’intégrité du journal des événements Windows est supprimé.
  • Les cinq compteurs de performances de l’espace de travail Log Analytics sont supprimés.

Pour réactiver Insights, procédez comme suit :

  1. Sélectionnez la vignette Insights sous Fonctionnalités.

  2. Sélectionnez Mettre à jour pour afficher à nouveau les visualisations.

    Capture d’écran montrant la fenêtre Update Insights.

Résolution des problèmes

Cette section fournit des conseils pour résoudre les problèmes liés à l’utilisation d’Insights pour Azure Stack HCI.

Résoudre les problèmes de page classeurs vides sans données renseignées

Émettre. Vous voyez une page classeurs vide sans données renseignées, comme illustré dans la capture d’écran suivante :

Capture d’écran d’une page classeurs vide.

Causes possibles. Il peut y avoir plusieurs causes pour ce problème, telles que la configuration récente d’Insights ou une configuration incorrecte du DCR associé.

Solution. Pour résoudre le problème, effectuez les étapes suivantes dans la séquence :

  1. Si vous avez récemment configuré Insights, attendez jusqu’à une heure pour qu’AMA collecte des données.
  2. Vérifiez la configuration du DCR associé. Assurez-vous que les canaux d’événements et les compteurs de performances sont ajoutés en tant que sources de données à la DCR associée, comme décrit dans la section Règles de collecte de données.
  3. Si le problème persiste après avoir effectué les étapes ci-dessus et que vous ne voyez toujours aucune donnée, contactez le support technique pour obtenir de l’aide.

Pour obtenir des conseils de résolution des problèmes plus détaillés, consultez conseils de résolution des problèmes pour l’agent Azure Monitor.

Visualisations d’insights

Une fois Insights activé, les tableaux suivants fournissent des détails sur toutes les ressources.

Intégrité

Fournit des erreurs d’intégrité sur un cluster.

Métrique Description Unité Exemple
Erreur Brève description des erreurs d’intégrité. En cliquant sur le lien, un panneau latéral s’ouvre avec plus d’informations. Aucune unité PoolCapacityThresholdExceeded
Type de ressource défaillante Type de ressource qui a rencontré une erreur. Aucune unité StoragePool
ID de ressource défaillante ID unique pour la ressource qui a rencontré une erreur d’intégrité. ID unique {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1e1} : SP :{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2}
Niveau de gravité La gravité de l’erreur peut être avertissement ou critique. Aucune unité Avertissement
Heure d’erreur initiale Timestamp de la dernière mise à jour du serveur. Datetime 09/04/2022 12:15:42

Serveur

Métrique Description Unité Exemple
Serveurs Noms des serveurs dans le cluster. Aucune unité VM-1
Dernière mise à jour Date et heure de la dernière mise à jour du serveur. Datetime 09/04/2022 12:15:42
État Intégrité des ressources du serveur dans le cluster. Il peut être sain, en avertissement, critique et autre. Healthy
Utilisation de l’UC Le % du temps que le processus a utilisé le processeur. Pourcentage 56 %
Utilisation de la mémoire L’utilisation de la mémoire du processus serveur est égale à Octets traités/privés, plus la taille des données mappées en mémoire. Pourcentage 16 %
Processeurs logiques Nombre de processeurs logiques. Count 2
UC Nombre de processeurs. Count 2
Durée active Temps pendant lequel une machine, en particulier un ordinateur, est en cours d’opération. Timespan 2 609 h
Site Nom du site auquel appartient le serveur. Nom du site SiteA
Nom de domaine Domaine local auquel le serveur appartient. Aucune unité Contoso.local

Machines virtuelles

Fournit l’état de toutes les machines virtuelles du cluster. Une machine virtuelle peut se trouver dans l’un des états suivants : exécution, arrêt, échec ou autre (inconnu, démarrage, capture instantanée, enregistrement, arrêt, pause, pause, suspension).

Métrique Description Unité Exemple
Serveurs Le nom du serveur Aucune unité Sample-VM-1
Dernière mise à jour Cela donne la date et l’heure de la dernière mise à jour du serveur Datetime 09/04/2022 12:24:02
Nombre total de machines virtuelles Nombre de machines virtuelles dans un nœud de serveur. Count 0 sur 0 en cours d’exécution
Exécution Nombre de machines virtuelles en cours d’exécution dans un nœud de serveur. Count 2
Arrêté Nombre de machines virtuelles arrêtées dans un nœud de serveur. Count 3
Échec Nombre de machines virtuelles ayant rencontré une erreur dans un nœud de serveur. Count 2
Other Si la machine virtuelle se trouve dans l’un des états suivants (Inconnu, Démarrage, Capture instantanée, Enregistrement, Arrêt, Suspension, Reprise, Pause, Suspendu), il est considéré comme « Autre ». Count 2

Stockage

Le tableau suivant fournit l’intégrité des volumes et des lecteurs dans le cluster :

Métrique Description Unité Exemple
Volumes Nom du volume Aucune unité ClusterPerformanceHistory
Dernière mise à jour Date et heure de la dernière mise à jour du stockage. Datetime 14/04/2022 14:58:55
État L’état du volume. Sain, en avertissement, critique et autre Healthy
Capacité totale Capacité totale de l’appareil en octets pendant la période de reporting. Octets 2.5 Go
Capacité disponible Capacité disponible en octets pendant la période du rapport. Octets 20B
Iops Opérations d’entrée/sortie par seconde. À la seconde 45/s
Débit Nombre d’octets par seconde servis par Application Gateway. Octets par seconde 5 bits/s
Latence Temps moyen nécessaire à la fin de la demande d’E/S. Second 0.0016 s
Résilience Capacité de récupération suite à des défaillances. Optimise la disponibilité des données. Aucune unité Miroir triple :
Déduplication Processus de réduction du nombre physique d’octets de données qui doivent être stockés sur le disque. Disponible ou non Oui/non
Système de fichiers Type de système de fichiers. Aucune unité ReFS

Tarification Azure Monitor

Lorsque vous activez la visualisation de surveillance, les journaux sont collectés à partir des points suivants :

  • Gestion de l’intégrité (Microsoft-windows-health/operational).
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).

Vous êtes facturé en fonction de la quantité de données ingérées et des paramètres de rétention des données de votre espace de travail Log Analytics.

Azure Monitor offre une tarification avec paiement à l’accès, et les cinq premiers Go du compte de facturation par mois est gratuit. Étant donné que la tarification peut varier selon plusieurs facteurs, notamment la région Azure que vous utilisez, consultez la calculatrice de prix Azure Monitor pour obtenir les calculs de tarification les plus récents.

Étapes suivantes