Surveiller un seul cluster Azure Stack HCI avec Insights
S’applique à : Azure Local, version 22H2
Important
Azure Stack HCI fait désormais partie d’Azure Local. Le changement de nom de la documentation produit est en cours. Toutefois, les versions antérieures d’Azure Stack HCI, par exemple 22H2, continueront de référencer Azure Stack HCI et ne reflèteront pas la modification du nom. Plus d’informations
Cet article explique comment utiliser Insights pour surveiller un seul cluster Azure Stack HCI. Pour plusieurs clusters Azure Stack HCI, consultez Surveiller plusieurs clusters Azure Stack HCI avec Insights.
Insights est une fonctionnalité d’Azure Monitor qui vous permet de surveiller rapidement votre cluster Azure Stack HCI. Vous pouvez afficher les métriques clés, l’intégrité et les informations d’utilisation relatives au cluster, aux serveurs, aux machines virtuelles et au stockage.
Important
Si vous avez inscrit votre cluster Azure Stack HCI et configuré Insights avant novembre 2023, certaines fonctionnalités qui utilisent l’agent Azure Monitor (AMA) comme Arc for Servers, VM Insights, Defender pour le cloud ou Sentinel peuvent ne pas collecter correctement les journaux et les données d’événement. Pour obtenir des conseils de dépannage, consultez la section Résoudre les problèmes des clusters inscrits avant novembre 2023 .
Avantages
Insights pour Azure Stack HCI offre les avantages suivants :
Géré par Azure. Insights est géré par Azure et accessible via le Portail Azure, ce qui garantit qu’il est toujours à jour. Il n’est pas nécessaire de configurer une base de données ou un logiciel spécial.
Scalabilité. Insights est capable de charger plus de 400 ensembles d’informations de cluster sur plusieurs abonnements simultanément. Il n’existe aucune limitation sur le cluster, le domaine ou l’emplacement physique.
Possibilités de personnalisation. L’expérience d’Insight est basée sur les modèles de classeur Azure Monitor. Cela vous permet de modifier les vues et requêtes, de modifier ou de définir des seuils qui s’alignent sur vos limites spécifiques, puis d’enregistrer ces personnalisations dans un classeur. Vous pouvez ensuite épingler des graphiques dans les classeurs aux tableaux de bord Azure.
Configurer Insights pour Azure Stack HCI
Les conditions préalables et les paramètres d’utilisation d’Insights varient en fonction de la version d’Azure Stack HCI dont vous disposez. Sélectionnez l’un des onglets suivants pour obtenir des instructions sur l’utilisation d’Insights sur votre version spécifique d’Azure Stack HCI.
La fonctionnalité Insights d’Azure Stack HCI, versions 22H2 et ultérieures, utilise AMA, qui offre des avantages significatifs par rapport à l’ancien Microsoft Monitoring Agent (MMA) utilisé dans Azure Stack HCI, version 21H2 et versions antérieures. Ces avantages incluent une vitesse améliorée, une sécurité améliorée et des performances supérieures. Vous pouvez intégrer de nouveaux nœuds à AMA ou migrer vos nœuds existants de l’agent hérité vers AMA.
Nous vous recommandons de mettre à niveau votre système Azure Stack HCI vers la version 22H2 ou ultérieure pour tirer parti de l’expérience Insights avec AMA.
À compter de la mise à jour cumulative de mai 2023 pour Azure Stack HCI, version 22H2, vous pouvez surveiller les systèmes Azure Stack HCI locaux avec Insights pour Azure Stack HCI.
Prérequis
Voici les conditions préalables à l’utilisation d’Insights pour Azure Stack HCI :
Le cluster Azure Stack HCI doit être inscrit auprès d’Azure et d’Arc. Si vous avez inscrit votre cluster le 15 juin 2021 ou après cette date, vous n’avez rien à faire. Sinon, vous devez activer l’intégration d’Azure Arc.
Le cluster doit disposer d’Azure Stack HCI, version 22H2 et de la mise à jour cumulative de mai 2023 ou ultérieure installée.
L’identité managée de la ressource Azure doit être activée. Pour plus d’informations, consultez Gestion améliorée activée.
Activer les insights
L’activation d’Insights vous aide à surveiller tous les clusters Azure Stack HCI actuellement associés à l’espace de travail Log Analytics en fournissant des métriques d’intégrité utiles. Insights installe l’agent Azure Monitor et vous aide à configurer des règles de collecte de données (DCR) pour surveiller votre cluster Azure Stack HCI.
Pour activer cette fonctionnalité à partir du portail Azure, effectuez ces étapes :
Dans le Portail Azure, accédez à votre page de ressources de cluster Azure Stack HCI, puis sélectionnez votre cluster. Sous l’onglet Fonctionnalités, sélectionnez Insights.
Dans la page Insights , sélectionnez Prise en main.
Remarque
Le bouton Prise en main est disponible uniquement pour Azure Stack HCI, version 22H2 avec la mise à jour cumulative de mai 2023 ou une version ultérieure installée et uniquement une fois l’identité managée activée. Sinon, ce bouton est désactivé.
Dans la page de configuration Insights, sélectionnez une DCR existante dans la liste déroulante des règles de collecte de données. Le DCR spécifie les journaux d’événements et les compteurs de performances qui doivent être collectés et les stocke dans un espace de travail Log Analytics. Insights crée une DCR par défaut si elle n’existe pas déjà. Seuls les contrôleurs de domaine activés pour Insights sont inclus.
(Facultatif) Vous pouvez également créer une DCR en sélectionnant Créer nouveau dans la page de configuration Insights.
Important
Nous vous recommandons vivement de ne pas créer votre propre DCR. La DCR créée par Insights inclut un flux de données spécial requis pour son opération. Vous pouvez modifier cette DCR pour collecter plus de données, telles que les événements Windows et Syslog. Les contrôleurs de domaine créés via l’installation AMA auront un préfixe
AzureStackHCI-
attaché au nom DCR.Dans la page Nouvelle règle de collecte de données, spécifiez l’abonnement, le nom DCR et le nom du point de terminaison de collecte de données (DCE). Les contrôleurs de domaine sont utilisés pour accéder au service de configuration afin d’extraire les contrôleurs de domaine associés pour l’agent Azure Monitor. Pour plus d’informations sur DCE, consultez les points de terminaison de collecte de données dans Azure Monitor.
Remarque
Si vous utilisez des liens privés sur l’agent, vous devez ajouter des contrôleurs de domaine. Pour plus d’informations sur les paramètres réseau AMA, consultez Définir les paramètres réseau de l’agent Azure Monitor.
Sélectionnez le bouton Vérifier + Créer.
Si une DCR n’est pas déjà créée pour le cluster non surveillé, celle-ci est créée avec les compteurs de performances activés et le canal du journal des événements Windows activé.
Passez en revue l’écran final avec un résumé du nom DCR, du nombre de journaux d’événements, des compteurs de performances et du nom de l’espace de travail Log Analytics dans lequel les données sont stockées. Sélectionnez Configurer.
Après avoir sélectionné Configurer, vous êtes redirigé vers la page Extensions , où vous pouvez voir l’état de votre installation de l’agent. En configurant Insights, AMA est automatiquement installé sur tous les nœuds du cluster.
Accédez à votre page de ressources de cluster Azure Stack HCI, puis sélectionnez votre cluster. Insights s’affiche désormais comme configuré sous l’onglet Fonctionnalités :
Règles de collecte de données
Lorsque vous activez Insights sur une machine avec l’agent Azure Monitor, vous devez spécifier une DCR à utiliser. Pour plus d’informations sur les contrôleurs de domaine, consultez les règles de collecte de données dans Azure Monitor.
Option | Description |
---|---|
Compteurs de performance | Spécifie les compteurs de performances de données à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Ces compteurs de performances sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, le classeur Insights utilise cinq compteurs de performances - Memory()\Available Bytes , , Network Interface()\Bytes Total/sec Processor(_Total)\% Processor Time , , RDMA Activity()\RDMA Inbound Bytes/sec etRDMA Activity()\RDMA Outbound Bytes/sec |
Canal du journal des événements | Spécifie les journaux des événements Windows à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Les journaux des événements Windows sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, les données sont collectées via deux canaux de journal des événements Windows : - microsoft-windows-health/operational et microsoft-windows-sddc-management/operational |
Espace de travail Log Analytics | Espace de travail pour stocker les données. Seuls les espaces de travail avec Insights sont répertoriés. |
Canal d’événements
Le Microsoft-windows-sddc-management/operational
canal d’événements Windows et Microsoft-windows-health/operational
le canal d’événements Windows sont ajoutés à votre espace de travail Log Analytics sous les journaux des événements Windows.
En collectant ces journaux, Insights affiche l’état d’intégrité des serveurs, lecteurs, volumes et machines virtuelles individuels. Par défaut, cinq compteurs de performances sont ajoutés.
Compteurs de performance
Par défaut, cinq compteurs de performances sont ajoutés :
Le tableau suivant décrit les compteurs de performance supervisés :
Compteurs de performance | Description |
---|---|
Mémoire (*)\Octets disponibles | Octets disponibles est la quantité de mémoire physique, en octets, immédiatement disponible pour l'allocation à un processus ou pour l'utilisation du système. |
Performances Interface réseau(*)\Total des octets/s | Vitesse à laquelle les octets sont envoyés et reçus sur chaque carte réseau, y compris les caractères de trame. Total des octets/s est la somme des octets reçus par seconde et des octets envoyés par seconde. |
Processor(_Total) % de temps de processeur | Temps écoulé en pourcentage que tous les threads de processus a passé à utiliser le processeur pour exécuter des instructions. |
Activité RDMA(*)\Octets entrants/s RDMA | Taux de données reçues sur RDMA par la carte réseau par seconde. |
Activité RDMA(*)\Octets sortants/s RDMA | Taux de données envoyés sur RDMA par la carte réseau par seconde. |
Après avoir activé Insights, il peut prendre jusqu’à 15 minutes pour collecter les données. Une fois le processus terminé, vous pouvez voir une visualisation complète de l’intégrité de votre cluster à partir du menu Insights dans le volet gauche :
Désactiver Insights
Pour désactiver Insights, procédez comme suit :
Lorsque vous désactivez la fonctionnalité Insights, l’association entre la règle de collecte de données et le cluster est supprimée et les journaux de gestion du service d’intégrité et du SDDC ne sont plus collectés ; toutefois, les données existantes ne sont pas supprimées. Si vous souhaitez supprimer ces données, accédez à votre espace de travail DCR et Log Analytics et supprimez les données manuellement.
Mettre à jour Insights
La vignette Insights affiche un message Nécessite une mise à jour dans les cas suivants :
- Une règle de collecte de données est modifiée.
- Un événement d’intégrité du journal des événements Windows est supprimé.
- Les cinq compteurs de performances de l’espace de travail Log Analytics sont supprimés.
Pour réactiver Insights, procédez comme suit :
Sélectionnez la vignette Insights sous Fonctionnalités.
Sélectionnez Mettre à jour pour afficher à nouveau les visualisations.
Migrer à partir de Microsoft Monitoring Agent
Pour migrer de Microsoft Monitoring Agent (MMA) vers Azure Monitoring Agent (AMA), faites défiler vers le bas jusqu’à Insights.
Sélectionnez Installer AMA ; la fenêtre de configuration Insights s’ouvre.
Sélectionnez ou créez une règle de collecte de données comme décrit précédemment dans la section Activer Insights .
L’agent Azure Monitor et l’extension Microsoft Monitoring Agent peuvent être installés sur le même ordinateur pendant la migration. L’exécution des deux agents peut entraîner une duplication des données et une augmentation des coûts. Si un ordinateur a installé les deux agents, vous voyez un avertissement dans le Portail Azure que vous collectez peut-être des données en double, comme illustré dans la capture d’écran suivante.
Avertissement
La collecte de données en double à partir d’une seule machine avec l’agent Azure Monitor et l’extension Microsoft Monitoring Agent peut entraîner un coût d’ingestion supplémentaire lors de l’envoi de données en double à l’espace de travail Log Analytics.
Vous devez supprimer l’extension Microsoft Monitoring Agent vous-même des ordinateurs qui l’utilisent. Avant d’effectuer cette étape, vérifiez que l’ordinateur ne s’appuie pas sur d’autres solutions qui nécessitent Microsoft Monitoring Agent. Après avoir vérifié que MicrosoftMonitoringAgent n’est pas encore connecté à votre espace de travail Log Analytics, vous pouvez supprimer MicrosoftMonitoringAgent manuellement en redirigeant vers la page Extensions .
Résolution des problèmes
Cette section fournit des conseils pour résoudre les problèmes liés à l’utilisation d’Insights pour Azure Stack HCI.
Résoudre les problèmes liés aux clusters inscrits avant novembre 2023
Émettre. Dans les clusters inscrits avant novembre 2023, les fonctionnalités qui utilisent AMA sur Azure Stack HCI, telles que Arc for Servers, VM Insights, Container Insights, Defender pour le cloud et Sentinel peuvent ne pas collecter correctement les journaux et les données d’événement.
Cause. Avant novembre 2023, l’inscription du cluster a configuré AMA pour utiliser l’identité du cluster, tandis que les services qui utilisent AMA sur Azure Stack HCI ont requis l’identité du nœud de cluster pour la collecte de journaux appropriée. Cette incompatibilité a entraîné une collecte incorrecte des journaux d’activité de ces services.
Solution. Pour résoudre ce problème, nous avons apporté une modification à l’inscription du cluster HCI pour QU’AMA utilise l’identité du serveur à la place. Pour implémenter cette modification, effectuez les étapes suivantes sur les clusters inscrits avant novembre 2023 :
- Réparer l’inscription du cluster. Consultez Réparer l’inscription du cluster.
- Réparer AMA. Voir Réparer AMA.
- Reconfigurez Insights pour Azure Stack HCI. Consultez Reconfigure Insights pour Azure Stack HCI.
Dans le Portail Azure, la page Insights pour Azure Stack HCI détecte automatiquement la modification de la configuration AMA et affiche une bannière en haut de la page, ce qui vous guide à prendre les mesures nécessaires pour continuer à utiliser les services qui s’appuient sur AMA.
Réparer l’inscription du cluster
Procédez comme suit pour réparer l’inscription du cluster :
Sur vos nœuds de cluster, installez le dernier
Az.StackHCI
module PowerShell. Remplacez parlatestversion
le numéro de version le plus récentAz.StackHCI
.Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force
Exécutez la commande d’inscription de réparation pour supprimer la clé régulière :
Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration
Réparer AMA pour Azure Stack HCI
Choisissez l’une des options suivantes pour réparer AMA :
Option 1 : Désinstaller AMA
Si AMA est déjà mis à jour, désinstallez-le. Procédez comme suit pour désinstaller AMA :
Option 2 : Mettre à jour AMA
Procédez comme suit pour mettre à jour AMA :
Option 3 : Redémarrer AMA
Suivez ces étapes sur tous les nœuds de cluster pour redémarrer AMA :
Exécutez la commande suivante pour désactiver AMA :
cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number> AzureMonitorAgentExtension.exe disable
Une fois l’exécutable terminé et que tous les processus AMA s’arrêtent, exécutez la commande suivante pour redémarrer l’agent :
AzureMonitorAgentExtension.exe enable
Option 4 : Redémarrer vos nœuds de cluster
Reconfigurer Insights pour Azure Stack HCI
Procédez comme suit pour reconfigurer Insights pour Azure Stack HCI :
Dans la Portail Azure, la page Insights de votre cluster Azure Stack HCI affiche une bannière en haut, comme illustré dans la capture d’écran suivante, ce qui vous aide à configurer Insights à nouveau et à associer DCR aux nœuds de cluster. Passez en revue la bannière et sélectionnez Configurer Insights.
Reconfigurez DCR. Suivez les instructions pour configurer Insights comme indiqué dans cet article. Consultez Configurer Insights pour Azure Stack HCI.
Résoudre les problèmes de page classeurs vides sans données renseignées
Émettre. Vous voyez une page classeurs vide sans données renseignées, comme illustré dans la capture d’écran suivante :
Causes possibles. Il peut y avoir plusieurs causes possibles pour ce problème, notamment la configuration récente d’Insights, les étapes de résolution des problèmes incomplètes pour les clusters inscrits avant novembre 2023 ou le DCR associé qui n’est pas configuré correctement.
Solution. Pour résoudre le problème, effectuez les étapes suivantes dans la séquence :
- Si vous avez récemment configuré Insights, attendez jusqu’à une heure pour qu’AMA collecte des données.
- S’il n’y a toujours aucune donnée après l’attente, vérifiez que vous avez effectué toutes les étapes mentionnées dans la section Résoudre les problèmes des clusters inscrits avant novembre 2023 .
- Vérifiez la configuration du DCR associé. Assurez-vous que les canaux d’événements et les compteurs de performances sont ajoutés en tant que sources de données à la DCR associée, comme décrit dans la section Règles de collecte de données.
- Si le problème persiste après avoir effectué les étapes ci-dessus et que vous ne voyez toujours aucune donnée, contactez le support technique pour obtenir de l’aide.
Pour obtenir des conseils de résolution des problèmes plus détaillés, consultez conseils de résolution des problèmes pour l’agent Azure Monitor.
Visualisations d’insights
Une fois Insights activé, les tableaux suivants fournissent des détails sur toutes les ressources.
Intégrité
Fournit des erreurs d’intégrité sur un cluster.
Métrique | Description | Unité | Exemple |
---|---|---|---|
Erreur | Brève description des erreurs d’intégrité. En cliquant sur le lien, un panneau latéral s’ouvre avec plus d’informations. | Aucune unité | PoolCapacityThresholdExceeded |
Type de ressource défaillante | Type de ressource qui a rencontré une erreur. | Aucune unité | StoragePool |
ID de ressource défaillante | ID unique pour la ressource qui a rencontré une erreur d’intégrité. | ID unique | {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1e1} : SP :{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2} |
Niveau de gravité | La gravité de l’erreur peut être avertissement ou critique. | Aucune unité | Avertissement |
Heure d’erreur initiale | Timestamp de la dernière mise à jour du serveur. | Datetime | 09/04/2022 12:15:42 |
Serveur
Métrique | Description | Unité | Exemple |
---|---|---|---|
Serveurs | Noms des serveurs dans le cluster. | Aucune unité | VM-1 |
Dernière mise à jour | Date et heure de la dernière mise à jour du serveur. | Datetime | 09/04/2022 12:15:42 |
État | Intégrité des ressources du serveur dans le cluster. | Il peut être sain, en avertissement, critique et autre. | Healthy |
Utilisation de l’UC | Le % du temps que le processus a utilisé le processeur. | Pourcentage | 56 % |
Utilisation de la mémoire | L’utilisation de la mémoire du processus serveur est égale à Octets traités/privés, plus la taille des données mappées en mémoire. | Pourcentage | 16 % |
Processeurs logiques | Nombre de processeurs logiques. | Count | 2 |
UC | Nombre de processeurs. | Count | 2 |
Durée active | Temps pendant lequel une machine, en particulier un ordinateur, est en cours d’opération. | Timespan | 2 609 h |
Site | Nom du site auquel appartient le serveur. | Nom du site | SiteA |
Nom de domaine | Domaine local auquel le serveur appartient. | Aucune unité | Contoso.local |
Machines virtuelles
Fournit l’état de toutes les machines virtuelles du cluster. Une machine virtuelle peut se trouver dans l’un des états suivants : exécution, arrêt, échec ou autre (inconnu, démarrage, capture instantanée, enregistrement, arrêt, pause, pause, suspension).
Métrique | Description | Unité | Exemple |
---|---|---|---|
Serveurs | Le nom du serveur | Aucune unité | Sample-VM-1 |
Dernière mise à jour | Cela donne la date et l’heure de la dernière mise à jour du serveur | Datetime | 09/04/2022 12:24:02 |
Nombre total de machines virtuelles | Nombre de machines virtuelles dans un nœud de serveur. | Count | 0 sur 0 en cours d’exécution |
Exécution | Nombre de machines virtuelles en cours d’exécution dans un nœud de serveur. | Count | 2 |
Arrêté | Nombre de machines virtuelles arrêtées dans un nœud de serveur. | Count | 3 |
Échec | Nombre de machines virtuelles ayant rencontré une erreur dans un nœud de serveur. | Count | 2 |
Other | Si la machine virtuelle se trouve dans l’un des états suivants (Inconnu, Démarrage, Capture instantanée, Enregistrement, Arrêt, Suspension, Reprise, Pause, Suspendu), il est considéré comme « Autre ». | Count | 2 |
Stockage
Le tableau suivant fournit l’intégrité des volumes et des lecteurs dans le cluster :
Métrique | Description | Unité | Exemple |
---|---|---|---|
Volumes | Nom du volume | Aucune unité | ClusterPerformanceHistory |
Dernière mise à jour | Date et heure de la dernière mise à jour du stockage. | Datetime | 14/04/2022 14:58:55 |
État | L’état du volume. | Sain, en avertissement, critique et autre | Healthy |
Capacité totale | Capacité totale de l’appareil en octets pendant la période de reporting. | Octets | 2.5 Go |
Capacité disponible | Capacité disponible en octets pendant la période du rapport. | Octets | 20B |
Iops | Opérations d’entrée/sortie par seconde. | À la seconde | 45/s |
Débit | Nombre d’octets par seconde servis par Application Gateway. | Octets par seconde | 5 bits/s |
Latence | Temps moyen nécessaire à la fin de la demande d’E/S. | Second | 0.0016 s |
Résilience | Capacité de récupération suite à des défaillances. Optimise la disponibilité des données. | Aucune unité | Miroir triple : |
Déduplication | Processus de réduction du nombre physique d’octets de données qui doivent être stockés sur le disque. | Disponible ou non | Oui/non |
Système de fichiers | Type de système de fichiers. | Aucune unité | ReFS |
Tarification Azure Monitor
Lorsque vous activez la visualisation de surveillance, les journaux sont collectés à partir des points suivants :
- Gestion de l’intégrité (Microsoft-windows-health/operational).
- SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).
Vous êtes facturé en fonction de la quantité de données ingérées et des paramètres de rétention des données de votre espace de travail Log Analytics.
Azure Monitor offre une tarification avec paiement à l’accès, et les cinq premiers Go du compte de facturation par mois est gratuit. Étant donné que la tarification peut varier selon plusieurs facteurs, notamment la région Azure que vous utilisez, consultez la calculatrice de prix Azure Monitor pour obtenir les calculs de tarification les plus récents.