Surveiller un seul cluster Azure Stack HCI version 23H2 avec Insights
S’applique à : Azure Stack HCI, version 23H2
Cet article explique comment utiliser Insights pour surveiller un seul cluster Azure Stack HCI. Pour plusieurs clusters Azure Stack HCI, consultez Surveiller plusieurs clusters Azure Stack HCI avec Insights.
Insights est une fonctionnalité d’Azure Monitor qui vous permet de surveiller rapidement votre cluster Azure Stack HCI. Vous pouvez afficher les métriques clés, l’intégrité et les informations d’utilisation relatives au cluster, aux serveurs, aux machines virtuelles et au stockage.
Prenez quelques instants pour regarder la procédure pas à pas vidéo sur Insights pour Azure Stack HCI :
Avantages
Insights pour Azure Stack HCI offre les avantages suivants :
Géré par Azure. Insights est géré par Azure et accessible via le Portail Azure, ce qui garantit qu’il est toujours à jour. Il n’est pas nécessaire de configurer une base de données ou un logiciel spécial.
Scalabilité. Insights est capable de charger plus de 400 ensembles d’informations de cluster sur plusieurs abonnements simultanément. Il n’existe aucune limitation sur le cluster, le domaine ou l’emplacement physique.
Possibilités de personnalisation. L’expérience d’Insight est basée sur les modèles de classeur Azure Monitor. Cela vous permet de modifier les vues et requêtes, de modifier ou de définir des seuils qui s’alignent sur vos limites spécifiques, puis d’enregistrer ces personnalisations dans un classeur. Vous pouvez ensuite épingler des graphiques dans les classeurs aux tableaux de bord Azure.
Prérequis
Voici les conditions préalables à l’utilisation d’Insights pour Azure Stack HCI :
Vous devez avoir accès à un cluster Azure Stack HCI déployé et inscrit.
L’identité managée de la ressource Azure doit être activée. Pour plus d’informations, consultez Gestion améliorée activée.
Activer les insights
L’activation d’Insights vous aide à surveiller tous les clusters Azure Stack HCI actuellement associés à l’espace de travail Log Analytics en fournissant des métriques d’intégrité utiles. Insights installe l’agent Azure Monitor et vous aide à configurer des règles de collecte de données (DCR) pour surveiller votre cluster Azure Stack HCI.
Pour activer Insights à grande échelle, consultez Activer Insights pour Azure Stack HCI à grande échelle à l’aide de stratégies Azure.
Procédez comme suit pour activer Insights à partir de la Portail Azure :
Dans le Portail Azure, accédez à votre page de ressources de cluster Azure Stack HCI, puis sélectionnez votre cluster. Sous l’onglet Fonctionnalités, sélectionnez Insights.
Dans la page Insights , sélectionnez Prise en main.
Dans la page de configuration Insights, sélectionnez une DCR existante dans la liste déroulante des règles de collecte de données. Le DCR spécifie les journaux d’événements et les compteurs de performances qui doivent être collectés et les stocke dans un espace de travail Log Analytics. Insights crée une DCR par défaut si elle n’existe pas déjà. Seuls les contrôleurs de domaine activés pour Insights sont inclus.
(Facultatif) Vous pouvez également créer une DCR en sélectionnant Créer nouveau dans la page de configuration Insights.
Important
Nous vous recommandons vivement de ne pas créer votre propre DCR. La DCR créée par Insights inclut un flux de données spécial requis pour son opération. Vous pouvez modifier cette DCR pour collecter plus de données, telles que les événements Windows et Syslog. Les contrôleurs de domaine créés via l’installation AMA auront un préfixe
AzureStackHCI-
attaché au nom DCR.Dans la page Nouvelle règle de collecte de données, spécifiez l’abonnement, le nom DCR et le nom du point de terminaison de collecte de données (DCE). Les contrôleurs de domaine sont utilisés pour accéder au service de configuration afin d’extraire les contrôleurs de domaine associés pour l’agent Azure Monitor. Pour plus d’informations sur DCE, consultez les points de terminaison de collecte de données dans Azure Monitor.
Remarque
Si vous utilisez des liens privés sur l’agent, vous devez ajouter des contrôleurs de domaine. Pour plus d’informations sur les paramètres réseau AMA, consultez Définir les paramètres réseau de l’agent Azure Monitor.
Sélectionnez le bouton Vérifier + Créer.
Si une DCR n’est pas déjà créée pour le cluster non surveillé, celle-ci est créée avec les compteurs de performances activés et le canal du journal des événements Windows activé.
Passez en revue l’écran final avec un résumé du nom DCR, du nombre de journaux d’événements, des compteurs de performances et du nom de l’espace de travail Log Analytics dans lequel les données sont stockées. Sélectionnez Configurer.
Après avoir sélectionné Configurer, vous êtes redirigé vers la page Extensions , où vous pouvez voir l’état de votre installation de l’agent. En configurant Insights, AMA est automatiquement installé sur tous les nœuds du cluster.
Accédez à votre page de ressources de cluster Azure Stack HCI, puis sélectionnez votre cluster. Insights s’affiche désormais comme configuré sous l’onglet Fonctionnalités :
Règles de collecte de données
Lorsque vous activez Insights sur une machine avec l’agent Azure Monitor, vous devez spécifier une DCR à utiliser. Pour plus d’informations sur les contrôleurs de domaine, consultez les règles de collecte de données dans Azure Monitor.
Option | Description |
---|---|
Compteurs de performance | Spécifie les compteurs de performances de données à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Ces compteurs de performances sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, le classeur Insights utilise cinq compteurs de performances - Memory()\Available Bytes , , Network Interface()\Bytes Total/sec Processor(_Total)\% Processor Time , , RDMA Activity()\RDMA Inbound Bytes/sec etRDMA Activity()\RDMA Outbound Bytes/sec |
Canal du journal des événements | Spécifie les journaux des événements Windows à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Les journaux des événements Windows sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, les données sont collectées via deux canaux de journal des événements Windows : - microsoft-windows-health/operational et microsoft-windows-sddc-management/operational |
Espace de travail Log Analytics | Espace de travail pour stocker les données. Seuls les espaces de travail avec Insights sont répertoriés. |
Canal d’événements
Le Microsoft-windows-sddc-management/operational
canal d’événements Windows et Microsoft-windows-health/operational
le canal d’événements Windows sont ajoutés à votre espace de travail Log Analytics sous les journaux des événements Windows.
En collectant ces journaux, Insights affiche l’état d’intégrité des serveurs, lecteurs, volumes et machines virtuelles individuels. Par défaut, cinq compteurs de performances sont ajoutés.
Compteurs de performance
Par défaut, cinq compteurs de performances sont ajoutés :
Le tableau suivant décrit les compteurs de performance supervisés :
Compteurs de performance | Description |
---|---|
Mémoire (*)\Octets disponibles | Octets disponibles est la quantité de mémoire physique, en octets, immédiatement disponible pour l'allocation à un processus ou pour l'utilisation du système. |
Performances Interface réseau(*)\Total des octets/s | Vitesse à laquelle les octets sont envoyés et reçus sur chaque carte réseau, y compris les caractères de trame. Total des octets/s est la somme des octets reçus par seconde et des octets envoyés par seconde. |
Processor(_Total) % de temps de processeur | Temps écoulé en pourcentage que tous les threads de processus a passé à utiliser le processeur pour exécuter des instructions. |
Activité RDMA(*)\Octets entrants/s RDMA | Taux de données reçues sur RDMA par la carte réseau par seconde. |
Activité RDMA(*)\Octets sortants/s RDMA | Taux de données envoyés sur RDMA par la carte réseau par seconde. |
Après avoir activé Insights, il peut prendre jusqu’à 15 minutes pour collecter les données. Une fois le processus terminé, vous pouvez voir une visualisation complète de l’intégrité de votre cluster à partir du menu Insights dans le volet gauche :
Désactiver Insights
Pour désactiver Insights, procédez comme suit :
Lorsque vous désactivez la fonctionnalité Insights, l’association entre la règle de collecte de données et le cluster est supprimée et les journaux de gestion du service d’intégrité et du SDDC ne sont plus collectés ; toutefois, les données existantes ne sont pas supprimées. Si vous souhaitez supprimer ces données, accédez à votre espace de travail DCR et Log Analytics et supprimez les données manuellement.
Mettre à jour Insights
La vignette Insights affiche un message Nécessite une mise à jour dans les cas suivants :
- Une règle de collecte de données est modifiée.
- Un événement d’intégrité du journal des événements Windows est supprimé.
- Les cinq compteurs de performances de l’espace de travail Log Analytics sont supprimés.
Pour réactiver Insights, procédez comme suit :
Sélectionnez la vignette Insights sous Fonctionnalités.
Sélectionnez Mettre à jour pour afficher à nouveau les visualisations.
Résolution des problèmes
Cette section fournit des conseils pour résoudre les problèmes liés à l’utilisation d’Insights pour Azure Stack HCI.
Résoudre les problèmes de page classeurs vides sans données renseignées
Émettre. Vous voyez une page classeurs vide sans données renseignées, comme illustré dans la capture d’écran suivante :
Causes possibles. Il peut y avoir plusieurs causes pour ce problème, telles que la configuration récente d’Insights ou une configuration incorrecte du DCR associé.
Solution. Pour résoudre le problème, effectuez les étapes suivantes dans la séquence :
- Si vous avez récemment configuré Insights, attendez jusqu’à une heure pour qu’AMA collecte des données.
- Vérifiez la configuration du DCR associé. Assurez-vous que les canaux d’événements et les compteurs de performances sont ajoutés en tant que sources de données à la DCR associée, comme décrit dans la section Règles de collecte de données.
- Si le problème persiste après avoir effectué les étapes ci-dessus et que vous ne voyez toujours aucune donnée, contactez le support technique pour obtenir de l’aide.
Pour obtenir des conseils de résolution des problèmes plus détaillés, consultez conseils de résolution des problèmes pour l’agent Azure Monitor.
Visualisations d’insights
Une fois Insights activé, les tableaux suivants fournissent des détails sur toutes les ressources.
Intégrité
Fournit des erreurs d’intégrité sur un cluster.
Métrique | Description | Unité | Exemple |
---|---|---|---|
Erreur | Brève description des erreurs d’intégrité. En cliquant sur le lien, un panneau latéral s’ouvre avec plus d’informations. | Aucune unité | PoolCapacityThresholdExceeded |
Type de ressource défaillante | Type de ressource qui a rencontré une erreur. | Aucune unité | StoragePool |
ID de ressource défaillante | ID unique pour la ressource qui a rencontré une erreur d’intégrité. | ID unique | {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1e1} : SP :{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2} |
Niveau de gravité | La gravité de l’erreur peut être avertissement ou critique. | Aucune unité | Avertissement |
Heure d’erreur initiale | Timestamp de la dernière mise à jour du serveur. | Datetime | 09/04/2022 12:15:42 |
Serveur
Métrique | Description | Unité | Exemple |
---|---|---|---|
Serveurs | Noms des serveurs dans le cluster. | Aucune unité | VM-1 |
Dernière mise à jour | Date et heure de la dernière mise à jour du serveur. | Datetime | 09/04/2022 12:15:42 |
État | Intégrité des ressources du serveur dans le cluster. | Il peut être sain, en avertissement, critique et autre. | Healthy |
Utilisation de l’UC | Le % du temps que le processus a utilisé le processeur. | Pourcentage | 56 % |
Utilisation de la mémoire | L’utilisation de la mémoire du processus serveur est égale à Octets traités/privés, plus la taille des données mappées en mémoire. | Pourcentage | 16 % |
Processeurs logiques | Nombre de processeurs logiques. | Count | 2 |
UC | Nombre de processeurs. | Count | 2 |
Durée active | Temps pendant lequel une machine, en particulier un ordinateur, est en cours d’opération. | Timespan | 2 609 h |
Site | Nom du site auquel appartient le serveur. | Nom du site | SiteA |
Nom de domaine | Domaine local auquel le serveur appartient. | Aucune unité | Contoso.local |
Machines virtuelles
Fournit l’état de toutes les machines virtuelles du cluster. Une machine virtuelle peut se trouver dans l’un des états suivants : exécution, arrêt, échec ou autre (inconnu, démarrage, capture instantanée, enregistrement, arrêt, pause, pause, suspension).
Métrique | Description | Unité | Exemple |
---|---|---|---|
Serveurs | Le nom du serveur | Aucune unité | Sample-VM-1 |
Dernière mise à jour | Cela donne la date et l’heure de la dernière mise à jour du serveur | Datetime | 09/04/2022 12:24:02 |
Nombre total de machines virtuelles | Nombre de machines virtuelles dans un nœud de serveur. | Count | 0 sur 0 en cours d’exécution |
Exécution | Nombre de machines virtuelles en cours d’exécution dans un nœud de serveur. | Count | 2 |
Arrêté | Nombre de machines virtuelles arrêtées dans un nœud de serveur. | Count | 3 |
Échec | Nombre de machines virtuelles ayant rencontré une erreur dans un nœud de serveur. | Count | 2 |
Other | Si la machine virtuelle se trouve dans l’un des états suivants (Inconnu, Démarrage, Capture instantanée, Enregistrement, Arrêt, Suspension, Reprise, Pause, Suspendu), il est considéré comme « Autre ». | Count | 2 |
Stockage
Le tableau suivant fournit l’intégrité des volumes et des lecteurs dans le cluster :
Métrique | Description | Unité | Exemple |
---|---|---|---|
Volumes | Nom du volume | Aucune unité | ClusterPerformanceHistory |
Dernière mise à jour | Date et heure de la dernière mise à jour du stockage. | Datetime | 14/04/2022 14:58:55 |
État | L’état du volume. | Sain, en avertissement, critique et autre | Healthy |
Capacité totale | Capacité totale de l’appareil en octets pendant la période de reporting. | Octets | 2.5 Go |
Capacité disponible | Capacité disponible en octets pendant la période du rapport. | Octets | 20B |
Iops | Opérations d’entrée/sortie par seconde. | À la seconde | 45/s |
Débit | Nombre d’octets par seconde servis par Application Gateway. | Octets par seconde | 5 bits/s |
Latence | Temps moyen nécessaire à la fin de la demande d’E/S. | Second | 0.0016 s |
Résilience | Capacité de récupération suite à des défaillances. Optimise la disponibilité des données. | Aucune unité | Miroir triple : |
Déduplication | Processus de réduction du nombre physique d’octets de données qui doivent être stockés sur le disque. | Disponible ou non | Oui/non |
Système de fichiers | Type de système de fichiers. | Aucune unité | ReFS |
Tarification Azure Monitor
Lorsque vous activez la visualisation de surveillance, les journaux sont collectés à partir des points suivants :
- Gestion de l’intégrité (Microsoft-windows-health/operational).
- SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).
Vous êtes facturé en fonction de la quantité de données ingérées et des paramètres de rétention des données de votre espace de travail Log Analytics.
Azure Monitor offre une tarification avec paiement à l’accès, et les cinq premiers Go du compte de facturation par mois est gratuit. Étant donné que la tarification peut varier selon plusieurs facteurs, notamment la région Azure que vous utilisez, consultez la calculatrice de prix Azure Monitor pour obtenir les calculs de tarification les plus récents.