Surveiller un environnement cloud
Vous avez besoin de l’observabilité de votre environnement cloud pour vous assurer que vos charges de travail s’exécutent correctement, que vous soyez propriétaire d’entreprise, propriétaire de la plateforme ou propriétaire de l’application. Vous devez savoir si :
- Vos applications sont disponibles et si elles s’exécutent aux attentes de vos clients.
- Vous avez des menaces de sécurité qui nécessitent une investigation.
- Vos coûts de consommation se trouvent dans la plage attendue.
La surveillance est le processus de collecte, d’analyse et d’action sur les données de télémétrie qui indiquent l’intégrité de votre plateforme, ressources et applications. Un environnement de supervision efficace inclut l’ensemble de votre patrimoine cloud, qui peut inclure des ressources sur plusieurs clouds et environnements locaux.
L’observabilité est une propriété d’un système qui mesure la façon dont ses états internes peuvent être déduits de ses sorties externes. Vous devez déployer des services et des processus pour surveiller votre environnement cloud. Et vous devez avoir la possibilité d’observer et de comprendre le comportement de vos services qui s’exécutent dans le cloud.
Avantages de la surveillance
Investissez dans votre environnement de supervision pour bénéficier des avantages suivants sur plusieurs aspects de votre cloud :
Disponibilité et performances : surveillez les ressources pour vous assurer que vos services et applications cloud sont disponibles et fonctionnent comme prévu. Pour identifier et répondre aux problèmes avant d’affecter les utilisateurs, suivez les métriques clés et configurez les règles d’alerte.
Optimisation des coûts : utilisez la supervision pour suivre l’utilisation des ressources et mettre à l’échelle les ressources en fonction de la demande. Cette approche permet d’éviter les ressources surprovisionnée et sous-utilisées, ce qui optimise les coûts. La surveillance peut également identifier et vous avertir des dépassements de coûts ou des pics inattendus d’utilisation.
Conformité : utilisez la surveillance pour gérer les journaux et les enregistrements des activités, ce qui permet de s’assurer que les services cloud respectent les stratégies et les réglementations. Les rapports qui utilisent ces données peuvent aider à effectuer des audits et des vérifications de conformité réguliers.
Sécurité : implémentez une surveillance continue pour détecter les menaces et les vulnérabilités de sécurité afin que vous puissiez agir immédiatement pour protéger les données et les ressources. Vous pouvez également analyser les données collectées pour la détection et la réponse aux menaces.
Plateformes de supervision
Une stratégie de surveillance efficace inclut toutes les plateformes de votre environnement informatique. En plus d’Azure, vous pouvez avoir des ressources locales, multiclouds et edge. Chaque ressource nécessite les mêmes niveaux de surveillance. Suivez le Framework d’adoption du cloud pour obtenir des conseils Azure et incluez la supervision dans votre stratégie d’exploitation unifiée. Dans cette stratégie, le cloud principal héberge vos outils de supervision et d’autres outils de gestion. Les outils de surveillance surveillent toutes les ressources sur toutes les plateformes.
Types de surveillance
La surveillance est une discipline multiforme qui nécessite une combinaison d’outils, de processus et de pratiques. Le tableau suivant décompose différents types de surveillance. Différents services et fonctionnalités peuvent fournir différentes combinaisons de ces types de surveillance. Toutefois, un environnement de supervision complet inclut tous ces types de surveillance sur chacune des plateformes de votre environnement informatique.
Type | Description |
---|---|
Infrastructure | La surveillance de l’infrastructure inclut les performances et la disponibilité des ressources cloud, telles que les machines virtuelles, les ressources de stockage et les réseaux. Ce type de supervision permet de garantir que l’infrastructure sous-jacente fonctionne de manière optimale, ce qui permet de maintenir la disponibilité et les performances des applications qui s’y appuient. |
Analyse des performances des applications (APM) | APM surveille les performances et la disponibilité des applications qui s’exécutent dans le cloud. Il suit les métriques telles que les temps de réponse, les taux d’erreur et les volumes de transactions. APM identifie les goulots d’étranglement des performances et permet de s’assurer que les applications répondent aux attentes des utilisateurs. |
Base de données | La surveillance des bases de données effectue le suivi des performances, de la disponibilité et de la consommation des ressources des bases de données cloud. Les métriques clés incluent les performances des requêtes, l’utilisation des index et l’état du verrou. |
Network (Réseau) | La surveillance du réseau suit les performances et la disponibilité des composants réseau dans l’environnement cloud. Les métriques incluent l’utilisation de la bande passante, la latence et la perte de paquets. |
Sécurité | La surveillance de la sécurité effectue le suivi et analyse les événements de sécurité et les vulnérabilités au sein de l’environnement cloud, notamment les accès non autorisés, les programmes malveillants et les violations de conformité. Une surveillance efficace de la sécurité permet de protéger les données sensibles, de garantir la conformité aux exigences réglementaires et d’empêcher les violations de sécurité coûteuses. |
Conformité | La surveillance de la conformité permet de s’assurer que l’environnement cloud respecte les normes réglementaires et sectorielles. Il effectue le suivi des configurations, des contrôles d’accès et des pratiques de gestion des données pour garantir la conformité aux réglementations pertinentes. |
Cost | La surveillance des coûts suit les dépenses cloud et l’utilisation des ressources pour identifier les opportunités d’économie de coûts et empêcher les dépassements de budget. Il surveille l’utilisation des ressources, identifie les ressources sous-utilisées et optimise les configurations de ressources pour réduire les coûts. |
Responsabilités partagées
Dans un environnement local, vous êtes responsable de tous les aspects de la supervision, car vous possédez et gérez toutes les ressources informatiques. Dans le cloud, vous partagez cette responsabilité avec votre fournisseur de cloud. Selon le type de modèle de déploiement que vous choisissez, les responsabilités de surveillance de différentes couches de la pile cloud peuvent être transférées de vous vers votre fournisseur de cloud.
Dans un déploiement IaaS (Infrastructure as a Service), le fournisseur de cloud surveille la plateforme cloud sous-jacente, telle que l’infrastructure physique et la couche de virtualisation. Et vous surveillez le système d’exploitation, les applications et les données qui s’exécutent sur les machines virtuelles que vous déployez sur la plateforme cloud. Lorsque le modèle de déploiement monte dans la pile, le fournisseur de cloud prend plus de responsabilités pour surveiller l’environnement. Cette responsabilité aboutit à un déploiement SaaS (Software as a Service), car vous transférez la responsabilité de surveillance au fournisseur cloud pour l’ensemble de la pile, y compris l’application et les données.
Vous pouvez utiliser des outils de surveillance du fournisseur de cloud pour surveiller vos couches de la pile, mais vous êtes responsable de la configuration de ces outils et de l’analyse des données qu’ils collectent. Vous devez accorder l’accès à différents membres de votre organisation et créer des tableaux de bord et des alertes pour les aider à distinguer les informations critiques. Vous devrez peut-être également intégrer ces composants à d’autres outils et systèmes de ticket utilisés par votre organisation.
Le fournisseur de cloud doit effectuer les mêmes types de service pour leurs couches de la pile que vous fournissez à vos clients internes. Ils doivent surveiller en permanence l’intégrité et les performances de la plateforme qu’ils contractent pour vous. Ils vous fournissent des tableaux de bord et des alertes pour vous avertir de manière proactive des problèmes de service. À l’instar de vos clients internes, vous n’avez pas besoin de visibilité sur la façon dont le fournisseur de cloud surveille sa plateforme, seulement qu’il répond aux contrats de niveau de service que vous contractez avec eux.
Rôles et responsabilités
La plupart des organisations d’entreprise disposent d’une équipe d’opérations centralisée qui surveille l’intégrité globale et les performances de l’environnement cloud.
Cette équipe est généralement la suivante :
- Définit les stratégies de l’entreprise globale.
- Effectue la configuration centralisée de l’environnement de surveillance.
- Délègue les autorisations aux parties prenantes de votre organisation qui nécessitent l’accès aux données de surveillance associées à leurs applications et services.
Les organisations ont plusieurs rôles qui gèrent l’environnement de surveillance et qui nécessitent l’accès aux données de surveillance pour effectuer leurs fonctions de travail. Chaque rôle a des exigences différentes pour surveiller les données en fonction de leurs responsabilités particulières. Selon la taille de votre organisation, vous pouvez avoir plusieurs personnes qui remplissent chaque rôle, ou vous pouvez avoir une personne qui remplit plusieurs rôles.
Les organisations individuelles peuvent distribuer des responsabilités différemment. Le tableau suivant montre un exemple de rôles et de responsabilités pour une organisation classique.
Rôle | Description |
---|---|
Architecte cloud | L’architecte cloud conçoit et supervise l’infrastructure cloud pour vous assurer qu’elle répond aux objectifs métier de l’organisation. L’architecte cloud se concentre sur la fiabilité, la sécurité et l’extensibilité de l’architecture cloud. Ils nécessitent une télémétrie de haut niveau pour obtenir une vue holistique du patrimoine numérique. Cette télémétrie inclut les métriques d’utilisation des ressources, les métriques APM, les insights de coût et de facturation et les rapports de conformité. |
Ingénieur plateforme | L’ingénieur de plateforme génère et gère la plateforme que les développeurs utilisent pour déployer leurs applications. L’ingénieur de plateforme peut créer des pipelines d’intégration continue et de livraison continue (CI/CD), gérer l’infrastructure cloud en tant que code (IaC) et garantir l’extensibilité et la fiabilité de la plateforme. L’ingénieur de plateforme nécessite des données de télémétrie sur l’état opérationnel de la plateforme. Cette télémétrie inclut les métriques de performances des conteneurs, les journaux d’orchestration, la validation IaC et la disponibilité des services. |
Administrateur système | L’administrateur système gère et gère les serveurs, les systèmes d’exploitation et d’autres composants d’infrastructure dans le cloud. Ils effectuent des sauvegardes, résolvent les problèmes et garantissent que les systèmes sont à jour. L’administrateur système nécessite des données de télémétrie au niveau du serveur et du système d’exploitation, notamment l’utilisation du processeur, de la mémoire et du disque, les performances réseau et les journaux système. |
Security Engineer | L’ingénieur de sécurité implémente et gère les mesures de sécurité pour protéger les données et les applications contre les menaces. L’ingénieur de sécurité gère tout, de la gestion des identités à la détection et à la réponse aux menaces. Ils utilisent des données de télémétrie sur les événements de sécurité, notamment les journaux d’accès, les alertes de détection des menaces, les évaluations des vulnérabilités et les métriques de conformité. |
Administrateur réseau | L’administrateur réseau gère et gère le réseau cloud pour vous assurer que les flux de données sont sécurisés et efficaces entre les serveurs, les applications et les utilisateurs. L’administrateur réseau gère les configurations réseau, surveille les performances et implémente des mesures de sécurité. Ils nécessitent des données de télémétrie centrées sur le réseau, notamment l’analyse du trafic réseau, les mesures de latence, la perte de paquets et les journaux de pare-feu. |
Administrateur de base de données (DBA) | L’administrateur de base de données gère et gère les bases de données pour garantir l’intégrité des données, les performances et la disponibilité. L’administrateur de base de données gère les sauvegardes de base de données et la récupération et optimise les requêtes pour une efficacité. Ils utilisent des données de télémétrie sur les performances et l’intégrité de la base de données, notamment les métriques de performances des requêtes, les temps de réponse de la base de données, les journaux des transactions et l’état de sauvegarde ou de récupération. |
Développeur | Le développeur conçoit, écrit, teste et gère le logiciel qui s’exécute sur des plateformes cloud. Le développeur crée des fonctionnalités et corrige des bogues pour vous assurer que l’application reste sécurisée et fonctionne correctement. Ils nécessitent des données de télémétrie spécifiques à l’application, notamment les taux d’erreur, la latence, les temps de réponse, l’analyse du comportement des utilisateurs et les métriques d’utilisation des fonctionnalités. |
Facilitation via Azure
Azure propose de nombreux services qui prennent en charge les différents types de supervision dont vous avez besoin dans votre environnement cloud. Chaque service cible un ou plusieurs rôles. Combinez les services pour fournir les fonctionnalités dont vous avez besoin pour un environnement de supervision complet.
Service | Description | Type | Rôles |
---|---|---|---|
Azure Monitor | Azure Monitor est au centre de l’écosystème de surveillance Azure. Il s’agit d’une solution de supervision complète que vous pouvez utiliser pour collecter, analyser et répondre aux données de surveillance à partir de vos environnements cloud et locaux. Azure Monitor fournit une surveillance complète de votre infrastructure, de votre réseau et de vos applications. Il fournit également une plateforme de données et des fonctionnalités principales, telles que l’analyse des données, la visualisation et les alertes pour d’autres services. | Infrastructure base de données compliance |
Architecte cloud, ingénieur de plateforme, administrateur système, DBA |
Application Insights | Application Insights est une fonctionnalité d’Azure Monitor qui fournit une surveillance APM pour vos applications cloud. | APM | Développeur |
Azure Network Watcher | Network Watcher fournit des fonctionnalités de surveillance et de visualisation pour les ressources réseau dans Azure. Utilisez ce service pour surveiller, diagnostiquer et afficher les métriques. Vous pouvez également activer ou désactiver des journaux pour les ressources d’un réseau virtuel Azure. | Network (Réseau) | Administrateur réseau |
Microsoft Sentinel | Microsoft Sentinel est une solution SIEM (Security Information Event Management) native cloud et de réponse automatisée de l’orchestration de la sécurité (SOAR). Il ingère des données de télémétrie de sécurité à partir de vos ressources Azure et d’autres composants pour fournir une détection, une investigation, une réponse et une chasse proactive aux cyber-menaces. | Sécurité | Security Engineer |
Microsoft Defender XDR | Defender XDR inclut des solutions de sécurité Microsoft natives de la plateforme Azure, du client et du serveur Microsoft et des applications, notamment Office 365, Exchange Online et SharePoint dans Microsoft 365. Chaque solution de sécurité utilise l’IA et le Machine Learning pour mettre en corrélation les données de télémétrie et déterminer si des enquêtes sont nécessaires. Lorsqu’ils détectent un comportement inacceptable, ils prennent des mesures pour prévenir les perturbations. | Sécurité | Security Engineer |
Microsoft Cost Management | Cost Management est une suite d’outils que vous pouvez utiliser pour analyser, surveiller et optimiser vos coûts Microsoft Cloud. Cost Management est disponible pour toute personne ayant accès à un compte de facturation, un abonnement, un groupe de ressources ou un groupe d’administration. | Cost | Architecte cloud |
Azure Service Health | Service Health fournit un état d’intégrité des services sur lesquels reposent vos ressources Azure. Il peut vous informer de toutes les pannes de service et fournir une vue personnalisée de l’intégrité de vos services et régions Azure. | Infrastructure | Fournisseur de cloud |