Considérations relatives à la surveillance des charges de travail Azure VMware Solution
Cet article décrit la zone de conception de surveillance d’une charge de travail Azure VMware Solution. Ce domaine se concentre sur les meilleures pratiques en matière d’observabilité. Les instructions sont destinées à une équipe des opérations. Microsoft, VMware et des tiers fournissent différents outils que vous pouvez utiliser pour surveiller votre infrastructure et votre application. Cet article répertorie ces options.
Chaque option offre des solutions de surveillance avec des coûts de licences, des options d’intégration, une étendue de surveillance et un support différents. Examinez attentivement les conditions générales applicables avant d’utiliser les outils.
Collecter des données d’infrastructure
Impact : Excellence opérationnelle
La surveillance de votre charge de travail implique la collecte de données à partir de Azure VMware Solution infrastructure et de divers composants de solution VMware. Azure VMware Solution est intégré au centre de données défini par logiciel (SDDC) VMware, qui exécute plusieurs composants natifs de solution VMware, tels que VMware Aria. Vous pouvez utiliser cette suite d’outils, notamment VMware Aria Operations, pour gérer différents aspects de votre infrastructure.
L’état d’intégrité VMware vSphere pour Azure VMware Solution est un autre outil à votre disposition. Cet outil permet de garantir que la détection et la correction proactives des problèmes sont effectuées en permanence dans votre environnement de Azure VMware Solution. En particulier, cet outil détecte des configurations incorrectes dans l’infrastructure VMware vSphere et détecte les goulots d’étranglement des performances. Il fournit également des informations sur l’utilisation des ressources et les performances globales en matière d’intégrité environnementale.
VMware Aria Operations for Networks vous aide à obtenir une visibilité réseau complète, à simplifier les processus de résolution des problèmes et à optimiser les performances réseau.
Recommandations
- Configurez l’état d’intégrité VMware vSphere pour obtenir une vue d’ensemble des status d’intégrité du cloud privé Azure VMware Solution.
- Utilisez des outils tiers comme VMware Aria Suite pour améliorer la visibilité et l’analyse de Azure VMware Solution infrastructure réseau de cloud privé.
- Utilisez des outils de supervision natifs Azure tels que :
- Azure Monitor.
- Opérations VMware Aria pour la supervision opérationnelle.
- Azure Policy et son tableau de bord associé pour la surveillance de la conformité.
- Microsoft Defender pour le cloud et Microsoft Sentinel pour la surveillance de la sécurité.
Gérer les journaux et les archives
Impact : Excellence opérationnelle
Pour obtenir des données d’intégrité à partir de composants de solution VMware, vous devez accéder aux journaux que le service syslog VMware collecte. VMware ESXi, VMware vSAN, VMware NSX-T Data Center et VMware vCenter Server sont des exemples de composants de solution. Les journaux de ces composants sont disponibles via Azure VMware Solution infrastructure. Un agent ou une extension Log Analytics envoie les journaux invités au niveau de la machine virtuelle à Log Analytics. Dans Azure VMware Solution, vous pouvez envoyer les journaux d’Azure VMware Solution à un objet blob de stockage natif Azure. Pour envoyer des journaux à un objet blob de stockage, vous pouvez configurer des redirecteurs à partir d’un serveur syslog centralisé, ou vous pouvez configurer l’objet blob comme destination dans Azure Monitor. Il est également possible d’utiliser un outil natif Azure tel qu’Azure Logic Apps ou Azure Functions pour transférer les journaux. Vous pouvez utiliser ces outils pour créer des écouteurs pour les journaux entrants à partir de Azure VMware Solution et pour envoyer les journaux à un objet blob de stockage.
L’archivage des journaux est une stratégie pour réduire vos coûts de stockage. Les objets blob stockage Azure et Log Analytics peuvent transférer des journaux pour l’archivage à long terme. L’utilisation d’un objet blob de stockage est l’option la moins coûteuse. Toutefois, Log Analytics dispose d’intégrations avancées pour l’alerte, la visualisation, l’interrogation et l’obtention d’insights basés sur le Machine Learning. Tenez compte de votre budget, des cas d’usage fonctionnels et des cas d’usage à long terme lorsque vous choisissez une solution.
Recommandations
- Collectez les journaux du service VMware syslog pour obtenir des données d’intégrité à partir de composants de solution VMware tels que VMware ESXi, VMware vSAN, VMware NSX-T Data Center et VMware vCenter Server.
- Configurez des outils tels que VMware Aria Operations pour la journalisation afin de collecter différents journaux pour les fonctionnalités d’interrogation, d’analyse et de création de rapports.
- Configurez des durées de rétention pour l’envoi de journaux au stockage à long terme afin de réduire le temps des requêtes et d’économiser sur les coûts de stockage.
Surveiller le système d’exploitation invité
Impact : Excellence opérationnelle
Dans le système d’exploitation invité, les métriques sont disponibles pour l’utilisation du disque, les performances de l’application, l’utilisation des ressources système et l’activité des utilisateurs. Envisagez d’utiliser Azure Arc pour Azure VMware Solution (préversion) pour gérer les ressources d’infrastructure VMware dans Azure. Pour plus d’informations, consultez Déployer Azure Arc pour Azure VMware Solution.
Recommandations
- Activez la gestion des invités et installez les extensions Azure une fois que votre cloud privé est activé par Azure Arc pour les serveurs ou Azure Arc pour Azure VMware Solution (préversion).
- Installez des agents supplémentaires pour collecter des données afin d’activer la gestion et la surveillance des invités sur Azure VMware Solution machines virtuelles invitées.
Implémenter la surveillance de la sécurité
Impact : Sécurité, excellence opérationnelle
La surveillance de la sécurité est essentielle pour détecter les activités anormales et y répondre. Les charges de travail qui s’exécutent dans un cloud privé Azure VMware Solution ont besoin d’une surveillance complète de la sécurité couvrant les réseaux, les ressources Azure et le Azure VMware Solution cloud privé lui-même. Vous pouvez centraliser les événements de sécurité en déployant un espace de travail Microsoft Sentinel. Grâce à cette intégration, l’équipe chargée des opérations peut afficher, analyser et détecter les incidents de sécurité dans le contexte d’un paysage plus large des menaces organisationnelles.
Recommandations
- Activez Defender pour le cloud sur l’abonnement Azure que vous utilisez pour déployer le Azure VMware Solution cloud privé. Vérifiez que dans le plan Defender pour le cloud, le paramètre Cloud Workload Protection (CWP) a la valeur ON pour les serveurs.
- Auditez les actions que les utilisateurs privilégiés effectuent sur le Azure VMware Solution cloud privé. Pour plus d’informations, consultez Historique des activités d’audit pour les affectations de groupe dans la gestion des identités privilégiées.
- Intégrez Microsoft Sentinel à Defender pour le cloud. Activez son collecteur de données pour les événements de sécurité et connectez-le à Defender pour le cloud.
- Utilisez les solutions de surveillance de la sécurité des partenaires validés dans Azure VMware Solution.
Surveiller et analyser les réseaux
Impact : Sécurité, excellence opérationnelle
Le processus de surveillance réseau inspecte tout le trafic qui entre et sort du Azure VMware Solution cloud privé. Dans Azure VMware Solution, la sécurité réseau fonctionne au niveau des couches réseau et hôte.
Recommandations
- Capturez et surveillez les journaux de pare-feu réseau déployés dans le cloud privé Azure VMware Solution. Surveillez également les journaux qui sont déployés dans Azure lorsque votre application s’étend à des appareils natifs Azure tels que Pare-feu Azure ou Azure Application Gateway. Pour plus d’informations, consultez Intégration du pare-feu Azure VMware Solution.
- Utilisez Pare-feu Azure Classeur ou des outils similaires pour surveiller les métriques et journaux courants liés aux appareils de pare-feu.
- Mettre en corrélation les journaux à partir de plusieurs vecteurs de sécurité tels que les vecteurs d’identité, de mise en réseau et d’infrastructure.
Configurer et simplifier les alertes
Impact : excellence opérationnelle, optimisation des coûts
Lorsque vous exécutez des charges de travail dans le Azure VMware Solution cloud privé, vous devez surveiller efficacement les performances des charges de travail. Par exemple, vous devez capturer les journaux, les métriques et les demandes de suivi pour vos couches d’application et d’infrastructure.
Les alertes peuvent vous aider à répondre aux modifications apportées à votre base de référence de performances. Vous pouvez également utiliser des alertes pour fournir des informations sur les modifications de maintenance ou de configuration nécessaires. Par instance, vous pouvez recevoir des notifications lorsqu’une clé expire, qu’une connexion est perdue ou qu’il existe un risque de dépassement de la capacité d’une ressource.
Pour rendre les alertes efficaces, configurez-les pour notifier les équipes responsables lorsque certaines conditions sont remplies. Envisagez également de consolider les alertes pour réduire le nombre de notifications individuelles envoyées :
- Au lieu d’émettre une alerte pour chaque machine qui manque d’espace, envisagez de consolider les alertes par hôtes, groupes de ressources ou clusters.
- Utilisez également cette approche pour les problèmes de l’hôte, le processeur et les pics de stockage.
- Basez les alertes sur les fenêtres de temps. Par exemple, si un hôte émet des alertes pendant une courte période, vous pouvez supprimer les alertes en fonction d’un seuil de temps défini. Pour instance, vous ne pouvez envoyer une alerte qu’après cinq minutes.
Recommandations
- Discutez et établissez des bases de référence basées sur les données de performances.
- Définissez des critères d’alerte pertinents tels que des seuils, des niveaux de gravité ou des conditions spécifiques.
- Utilisez le sous-système d’événements et d’alarmes VMware vSphere pour surveiller VMware vSphere et configurer des déclencheurs.
- Configurez les alertes Azure dans Azure VMware Solution pour répondre aux événements en temps réel.
- Assurez-vous que les alertes sont configurées afin que l’espace disponible du magasin de données VMware vSAN soit maintenu aux niveaux requis par votre contrat de niveau de service (SLA).
- Configurez des alertes d’intégrité des ressources pour obtenir les status d’intégrité en temps réel du cloud privé Azure VMware Solution.
- Utilisez les outils de surveillance des performances des applications (APM) pour obtenir des informations sur les performances au niveau du code de l’application.
- Utilisez une combinaison de techniques de surveillance telles que les transactions synthétiques, la surveillance des pulsations et la surveillance des points de terminaison.
- Hiérarchiser les alertes en fonction de leur impact sur les opérations ou de la criticité des systèmes affectés. Affiner les alertes pour déclencher uniquement des événements significatifs.
- Pour réduire le bruit et gérer efficacement les alertes, utilisez des méthodes permettant de réduire le nombre de notifications individuelles qui sont émises.
- Pour réduire la fatigue des alertes, utilisez un mécanisme pour informer les principales parties prenantes uniquement des événements importants.
- Utilisez des canaux de notification tels que les SMS, les e-mails, les notifications Push et les plateformes de collaboration telles que Microsoft Teams pour vous assurer que les alertes sont envoyées efficacement.
Gérer les coûts
Impact : optimisation des coûts, excellence opérationnelle
La surveillance des coûts fait référence à la possibilité de suivre les coûts associés au cloud privé Azure VMware Solution.
Recommandations
- Utilisez le sous-système d’événements et d’alarmes VMware vSphere pour surveiller VMware vSphere et configurer des déclencheurs.
- Configurez des alertes Azure basées sur des requêtes Log Analytics pour Azure VMware Solution. Ces alertes aident votre équipe d’exploitation à répondre aux événements attendus et inattendus en temps réel.
Utiliser les outils de résolution des problèmes et de débogage
Impact : optimisation des coûts, excellence opérationnelle
Pour déboguer et dépanner efficacement votre application, vous avez besoin de journaux, de métriques et d’informations associées. Ces informations incluent les activités d’événement afin que vous puissiez identifier, analyser et établir des connexions entre les événements.
Recommandations
- Configurez votre système pour transférer les journaux du service syslog Azure VMware Solution vers Log Analytics. Transférez tous les journaux, métriques et informations de diagnostic pertinents.
- Configurez un agent de serveur activé par Azure Arc sur des machines virtuelles invitées qui s’exécutent à l’intérieur du cloud privé Azure VMware Solution.
Utiliser les tableaux de bord
Impact : Excellence opérationnelle
Les tableaux de bord d’application vous aident à visualiser et à surveiller les performances, l’intégrité et d’autres métriques d’une application :
- Les rapports de surveillance dans les tableaux de bord vous aident à effectuer rapidement une analyse et une résolution des problèmes de cause racine. Les équipes d’exploitation peuvent utiliser ces tableaux de bord pour afficher toutes les ressources clés qui composent Azure VMware Solution dans un seul volet.
- Les métriques de tableau de bord fournissent des informations sur l’impact des modifications du code et de l’infrastructure sur le comportement des applications.
- Les visuels aident les équipes de support technique à comprendre l’impact des modifications, des performances et des problèmes de disponibilité sur une application.
- Les indicateurs de performance profitent au leadership exécutif et aux parties prenantes de l’entreprise. Ces outils informent les décisions qui alignent les performances d’une application sur les objectifs métier. Par exemple, un cadre peut surveiller l’engagement envers les clients en examinant des métriques telles que la disponibilité du service, les temps de résolution des incidents et les temps de réponse moyens. Ces métriques permettent de s’assurer que le organization fournit des services en fonction de son contrat SLA.
En plus d’offrir des insights, les tableaux de bord peuvent également promouvoir la transparence et encourager la collaboration, pour instance, lorsque vous accordez aux parties prenantes appropriées l’accès aux tableaux de bord d’application. Cet acte cultive une compréhension partagée des performances d’une application. Cette pratique permet également à un organization de prendre des décisions éclairées. Par conséquent, les parties prenantes peuvent se concentrer sur la poursuite d’initiatives cruciales qui propulsent l’entreprise vers l’avant.
Recommandations
- Créez un tableau de bord d’application avec Application Insights ou Grafana. Connectez le tableau de bord à des sources de données pertinentes qui stockent des métriques de votre environnement Azure VMware Solution.
- Créez un classeur Azure en tant que référentiel central pour les requêtes, les métriques et les rapports interactifs couramment exécutés.
- Assurez-vous que votre source de données s’aligne sur les exigences de sécurité et de conformité.
- Définissez des contrôles d’accès et des autorisations tels que l’authentification utilisateur et le contrôle d’accès en fonction du rôle. Assurez-vous que chaque partie prenante dispose d’un accès approprié en fonction de son rôle.
- Effectuez des révisions d’accès périodiques pour case activée que l’accès utilisateur est à jour et aligné sur les rôles et responsabilités actuels.
Étapes suivantes
Maintenant que vous avez examiné les meilleures pratiques d’observabilité dans Azure VMware Solution, explorez les mécanismes, les outils et les périmètres que vous pouvez utiliser pour sécuriser davantage les charges de travail dans le SDDC.
Utilisez l’outil d’évaluation pour évaluer vos choix de conception.