Surveiller un environnement cloud
Une observabilité de votre environnement cloud est nécessaire pour s’assurer que vos charges de travail s’exécutent correctement, que vous soyez propriétaire d’entreprise, propriétaire de la plateforme ou propriétaire de l’application. Ce que vous devez savoir :
- Si vos applications sont disponibles et si elles s’exécutent selon les attentes de vos clients.
- Si des menaces de la sécurité nécessitent une investigation.
- Si vos coûts de consommation sont dans l’étendue prévue.
La surveillance est le processus de collecte, d’analyse et d’action sur les données de télémétrie qui indique l’intégrité de votre plateforme, de vos ressources et de vos applications. Un environnement de surveillance efficace réunit l’ensemble de votre patrimoine cloud, ce qui peut inclure des ressources sur plusieurs clouds et environnements locaux.
L’observabilité est la propriété d’un système qui mesure la façon dont ses états internes peuvent être déduits de ses sorties externes. Vous devez déployer des services et des processus pour surveiller votre environnement cloud. Vous devez aussi avoir la possibilité d’observer et de comprendre le comportement de vos services qui s’exécutent dans le cloud.
Les avantages de la surveillance
Investissez dans votre environnement de surveillance pour bénéficier des avantages suivants sur plusieurs aspects de votre cloud :
Disponibilité et performances : surveillez les ressources pour vous assurer que vos services et applications cloud sont disponibles et qu’ils fonctionnent comme prévu. Pour identifier et répondre aux problèmes avant que les utilisateurs soient affectés, observez les métriques clés et configurez des règles d’alerte.
Optimisation des coûts : utilisez la surveillance pour suivre l’utilisation des ressources et mettre à l’échelle les ressources en fonction de la demande. Cette approche permet d’éviter les ressources surapprovisionnées et sous-utilisées, ce qui optimise les coûts. La surveillance peut également identifier et vous avertir des dépassements de coûts ou des pics inattendus d’utilisation.
Conformité : utilisez la surveillance pour gérer les journaux et les enregistrements des activités, ce qui permet de s’assurer que les services cloud respectent les stratégies et les réglementations. Les rapports qui utilisent ces données peuvent aider à effectuer régulièrement des audits et des vérifications de conformité.
Sécurité : implémentez une surveillance continue pour détecter les menaces et les vulnérabilités de sécurité afin que vous puissiez agir immédiatement pour protéger les données et les ressources. Vous pouvez également analyser les données collectées pour la détection et la réponse aux menaces.
Plateformes de surveillance
Une stratégie de surveillance efficace inclut toutes les plateformes de votre environnement informatique. En plus d’Azure, vous pouvez avoir des ressources locales, multiclouds et edge. Chaque ressource nécessite le même niveau de surveillance. Suivez le guide du framework d’adoption du cloud pour Azure et incluez la surveillance dans votre stratégie d’opérations unifiées. Dans cette stratégie, le cloud principal héberge vos outils de surveillance et d’autres outils de gestion. Les outils de surveillance surveillent toutes les ressources sur toutes les plateformes.
Types de surveillance
La surveillance est une discipline multiforme qui nécessite une combinaison d’outils, de processus et de pratiques. Le tableau suivant décompose différents types de surveillance. Différents services et fonctionnalités peuvent fournir différentes combinaisons de ces types de surveillance. Toutefois, un environnement de surveillance complet inclut tous ces types de surveillance sur chacune des plateformes de votre environnement informatique.
Type | Description |
---|---|
Infrastructure | La surveillance de l’infrastructure inclut les performances et la disponibilité des ressources cloud, telles que des machines virtuelles, des ressources de stockage et des réseaux. Ce type de surveillance permet de garantir que l’infrastructure sous-jacente fonctionne de manière optimale, et ainsi de maintenir la disponibilité et les performances des applications qui reposent dessus. |
Surveillance des performances des applications (APM) | APM surveille les performances et la disponibilité des applications qui s’exécutent dans le cloud. Il suit les métriques telles que les temps de réponse, les taux d’erreur et les volumes de transactions. APM identifie les goulots d’étranglement des performances et permet de s’assurer que les applications répondent aux attentes des utilisateurs. |
Base de données | La surveillance des bases de données effectue le suivi des performances, de la disponibilité et de la consommation des ressources des bases de données cloud. Les métriques clés incluent les performances des requêtes, l’utilisation des index et l’état du verrouillage. |
Réseau | La surveillance du réseau suit les performances et la disponibilité des composants réseau dans l’environnement cloud. Les métriques incluent l’utilisation de la bande passante, la latence et la perte de paquets. |
Sécurité | La surveillance de la sécurité effectue le suivi et analyse les événements de sécurité et les vulnérabilités au sein de l’environnement cloud, notamment les accès non autorisés, les programmes malveillants et les violations de conformité. Une surveillance efficace de la sécurité permet de protéger les données sensibles, de garantir la conformité aux exigences réglementaires et d’empêcher des violations de sécurité coûteuses. |
Conformité | La surveillance de la conformité permet de s’assurer que l’environnement cloud respecte les normes réglementaires et sectorielles. Elle effectue le suivi des configurations, des contrôles d’accès et des pratiques de gestion des données pour garantir la conformité aux réglementations pertinentes. |
Coût | La surveillance des coûts suit les dépenses cloud et l’utilisation des ressources pour identifier les opportunités d’économie de coûts et empêcher les dépassements de budget. Elle surveille l’utilisation des ressources, identifie les ressources sous-utilisées et optimise les configurations de ressources pour réduire les coûts. |
Responsabilités partagées
Dans un environnement local, vous êtes responsable de tous les aspects de la surveillance, car vous possédez et gérez toutes les ressources informatiques. Dans le cloud, vous partagez cette responsabilité avec votre fournisseur de cloud. Selon le type de modèle de déploiement que vous choisissez, les responsabilités de surveillance de différentes couches de la pile cloud peuvent être transférées entre vous et votre fournisseur de cloud.
Dans un déploiement IaaS (Infrastructure as a Service), le fournisseur de cloud surveille la plateforme cloud sous-jacente, telle que l’infrastructure physique et la couche de virtualisation. Vous, vous surveillez le système d’exploitation, les applications et les données qui s’exécutent sur les machines virtuelles que vous déployez sur la plateforme cloud. Lorsque le modèle de déploiement monte dans la pile, le fournisseur de cloud prend une plus grande responsabilité pour surveiller l’environnement. Cette responsabilité aboutit à un déploiement SaaS (Software as a Service), car vous transférez la responsabilité de surveillance au fournisseur de cloud pour l’ensemble de la pile, y compris l’application et les données.
Vous pouvez utiliser des outils de surveillance du fournisseur de cloud pour surveiller vos couches de la pile, mais vous êtes responsable de la configuration de ces outils et de l’analyse des données qu’ils collectent. Vous devez accorder l’accès à différents membres de votre organisation et créer des tableaux de bord et des alertes pour les aider à distinguer les informations critiques. Vous devrez peut-être également intégrer ces composants à d’autres outils et systèmes de ticket utilisés par votre organisation.
Le fournisseur de cloud doit effectuer les mêmes types de service pour leurs couches de la pile que vous fournissez à vos clients internes. Il doit surveiller en permanence l’intégrité et les performances de la plateforme qu’il contracte pour vous. Il vous fournit des tableaux de bord et des alertes pour vous avertir de manière proactive des problèmes de service. À l’instar de vos clients internes, vous n’avez pas besoin de visibilité sur la façon dont le fournisseur de cloud surveille sa plateforme. Il doit simplement répondre aux contrats de niveau de service que vous contractez avec eux.
Les rôles et responsabilités
La plupart des organisations d’entreprise disposent d’une équipe d’opérations centralisée qui surveille l’intégrité globale et les performances de l’environnement cloud.
Généralement, cette équipe :
- Définit les stratégies de l’entreprise globale.
- Effectue la configuration centralisée de l’environnement de surveillance.
- Délègue les autorisations aux parties prenantes de votre organisation qui nécessitent l’accès aux données de surveillance associées à leurs applications et services.
Les organisations ont plusieurs rôles qui gèrent l’environnement de surveillance et qui nécessitent l’accès aux données de surveillance pour effectuer leurs fonctions de travail. Chaque rôle a des exigences différentes pour surveiller les données en fonction de leurs responsabilités particulières. Selon la taille de votre organisation, plusieurs personnes peuvent remplir chaque rôle, ou une seule personne peut remplir plusieurs rôles.
Les organisations individuelles peuvent distribuer les responsabilités différemment. Le tableau suivant montre un exemple de rôles et de responsabilités pour une organisation classique.
Role | Description |
---|---|
Architecte Cloud | L’architecte cloud conçoit et supervise l’infrastructure cloud pour vous assurer qu’elle répond aux objectifs métier de l’organisation. L’architecte cloud se concentre sur la fiabilité, la sécurité et l’extensibilité de l’architecture cloud. Il a besoin d’une télémétrie de haut niveau pour obtenir une vue holistique du patrimoine numérique. Cette télémétrie inclut les métriques d’utilisation des ressources, les métriques APM, les insights de coût et de facturation et les rapports de conformité. |
Ingénieur Plateforme | L’ingénieur Plateforme génère et gère la plateforme que les développeurs utilisent pour déployer leurs applications. L’ingénieur Plateforme peut créer des pipelines d’intégration continue et de livraison continue (CI/CD), gérer l’infrastructure cloud en tant que code (IaC) et garantir l’extensibilité et la fiabilité de la plateforme. L’ingénieur Plateforme nécessite des données de télémétrie sur l’état opérationnel de la plateforme. Cette télémétrie inclut les métriques de performances des conteneurs, les journaux d’orchestration, la validation IaC et la disponibilité des services. |
Administrateur Système | L’administrateur Système gère et entretient les serveurs, les systèmes d’exploitation et d’autres composants d’infrastructure dans le cloud. Il effectue des sauvegardes, résout les problèmes et s’assure que les systèmes sont à jour. L’administrateur Système nécessite des données de télémétrie au niveau du serveur et du système d’exploitation, notamment l’utilisation du processeur, de la mémoire et du disque, les performances réseau et les journaux système. |
Ingénieur Sécurité | L’ingénieur Sécurité implémente et gère les mesures de sécurité pour protéger les données et les applications contre les menaces. L’ingénieur Sécurité gère tout, de la gestion des identités à la détection et à la réponse aux menaces. Il utilise des données de télémétrie sur les événements de sécurité, notamment les journaux d’accès, les alertes de détection des menaces, les évaluations des vulnérabilités et les métriques de conformité. |
Administrateur Réseau | L’administrateur Réseau gère et entretient le réseau cloud pour s4assurer que les flux de données sont sécurisés et efficaces entre les serveurs, les applications et les utilisateurs. L’administrateur Réseau gère les configurations réseau, surveille les performances et implémente des mesures de sécurité. Il nécessite des données de télémétrie centrées sur le réseau, notamment l’analyse du trafic réseau, les mesures de latence, la perte de paquets et les journaux de pare-feu. |
Administrateur Bases de données (DBA) | L’administrateur Bases de données gère et entretient les bases de données pour garantir l’intégrité des données, les performances et la disponibilité. L’administrateur Bases de données gère les sauvegardes de base de données et la récupération, et optimise les requêtes pour une meilleure efficacité. Il utilise les données de télémétrie sur les performances et l’intégrité de la base de données, notamment les métriques de performances des requêtes, les temps de réponse de la base de données, les journaux des transactions et l’état de sauvegarde ou de récupération. |
Développeur | Le développeur conçoit, écrit, teste et gère le logiciel qui s’exécute sur des plateformes cloud. Le développeur crée des fonctionnalités et corrige des bogues pour s’assurer que l’application reste sécurisée et qu’elle fonctionne correctement. Il a besoin de données de télémétrie spécifiques à l’application, notamment les taux d’erreur, la latence, les temps de réponse, l’analyse du comportement des utilisateurs et les métriques d’utilisation des fonctionnalités. |
Facilitation Azure
Azure propose de nombreux services qui prennent en charge les différents types de surveillance dont vous avez besoin dans votre environnement cloud. Chaque service cible un ou plusieurs rôles. Combinez les services pour fournir les fonctionnalités dont vous avez besoin pour un environnement de surveillance complet.
Service | Description | Type | Rôles |
---|---|---|---|
Azure Monitor | Azure Monitor est au centre de l’écosystème de surveillance Azure. Il s’agit d’une solution de surveillance complète que vous pouvez utiliser pour collecter, analyser et répondre aux données de surveillance à partir de vos environnements cloud et locaux. Azure Monitor fournit une surveillance complète de votre infrastructure, de votre réseau et de vos applications. Il fournit également une plateforme de données et des fonctionnalités principales, telles que l’analyse des données, la visualisation et les alertes pour d’autres services. | Infrastructure, base de données, conformité |
Architecte cloud, ingénieur plateforme, administrateur système, DBA |
Application Insights | Application Insights est une fonctionnalité d’Azure Monitor qui fournit une surveillance APM pour vos applications cloud. | APM | Développeur |
Azure Network Watcher | Network Watcher fournit des fonctionnalités de surveillance et de visualisation pour les ressources réseau dans Azure. Utilisez ce service pour surveiller, diagnostiquer et afficher les métriques. Vous pouvez également activer ou désactiver des journaux pour les ressources d’un réseau virtuel Azure. | Réseau | Administrateur Réseau |
Microsoft Sentinel | Microsoft Sentinel est une solution native cloud de types SIEM (Security Information and Event Management) et SOAR (Security Orchestrated Automated Response). Il ingère des données de télémétrie de sécurité à partir de vos ressources Azure et d’autres composants pour fournir une détection, une investigation, une réponse et une chasse proactive aux cyber-menaces. | Sécurité | Ingénieur Sécurité |
Microsoft Defender XDR | Defender XDR inclut des solutions de sécurité Microsoft natives de la plateforme Azure, du client et du serveur Microsoft et des applications, notamment Office 365, Exchange Online et SharePoint dans Microsoft 365. Chaque solution de sécurité utilise l’IA et le Machine Learning pour mettre en corrélation les données de télémétrie et déterminer si des enquêtes sont nécessaires. Lorsqu’elles détectent un comportement inacceptable, elles prennent des mesures pour prévenir les perturbations. | Sécurité | Ingénieur Sécurité |
Microsoft Cost Management | Cost Management est une suite d’outils que vous pouvez utiliser pour analyser, surveiller et optimiser vos coûts Microsoft Cloud. Cost Management est disponible pour toute personne ayant accès à un compte de facturation, un abonnement, un groupe de ressources ou un groupe d’administration. | Coût | Architecte Cloud |
Azure Service Health | Service Health fournit un état d’intégrité des services sur lesquels reposent vos ressources Azure. Il peut vous informer de toutes les pannes de service et fournir une vue personnalisée de l’intégrité de vos services et régions Azure. | Infrastructure | Fournisseur de cloud |
Liste complète des liens vers la documentation de supervision Azure
Le tableau répertorie les services Azure par ordre alphabétique et inclut des liens vers leurs conseils de surveillance pour presque tous les services.