Partager via


Concepts clés d’Operations Manager

Operations Manager, un composant de Microsoft System Center, est un logiciel qui vous permet de surveiller les services, les appareils et les opérations pour de nombreux ordinateurs à partir d’une seule console. Cet article explique les concepts de base relatifs à Operations Manager pour l’administrateur qui gère l’infrastructure Operations Manager et l’opérateur qui surveille et prend en charge les services informatiques pour votre entreprise.

Que fait Operations Manager

Les entreprises, petites et grandes, dépendent généralement des services et applications fournis par leur environnement informatique. Les services informatiques sont chargés de garantir les performances et la disponibilité de ces applications et services critiques. Cela signifie que les services informatiques doivent savoir quand il y a un problème, identifier où se trouve le problème et déterminer ce qui provoque le problème, idéalement avant que les utilisateurs des applications rencontrent les problèmes. Plus les ordinateurs et les appareils de l’entreprise, plus cette tâche est difficile.

L'utilisation d'Operations Manager dans l'environnement facilite l'analyse de plusieurs ordinateurs, périphériques, services et applications. La console Opérateur, illustrée dans l’image suivante, vous permet de vérifier l’intégrité, les performances et la disponibilité de tous les objets surveillés dans l’environnement et vous aide à identifier et résoudre les problèmes.

Capture d’écran de la console Opérateur.

Remarque

Pour en savoir plus sur les consoles Operations Manager, consultez Comparaison des consoles Operations Manager dans le Guide des opérations.

Operations Manager vous indiquera quels objets surveillés ne sont pas sains, envoyez des alertes quand des problèmes sont identifiés et fournissez des informations pour vous aider à identifier la cause d’un problème et des solutions possibles. En tant qu'administrateur, vous configurez ce qui sera analysé en sélectionnant des ordinateurs et des périphériques à analyser et en important des packs d'administration qui fournissent une analyse pour des fonctionnalités et applications spécifiques. Pour décider quels objets analyser et les éléments à analyser, vous devez comprendre les fonctionnalités qui composent l'infrastructure Operations Manager ainsi que le fonctionnement d'Operations Manager.

Infrastructure Operations Manager

L’installation d’Operations Manager crée un groupe d’administration. Le groupe d'administration est l'unité de base de la fonctionnalité. Au minimum, un groupe d'administration se compose d'un serveur d'administration, de la base de données opérationnelleet de la base de données de l'entrepôt de données de rapports.

  • Le serveur d'administration est le point focal pour administrer le groupe d'administration et communiquer avec la base de données. Lorsque vous ouvrez la console Opérateur et vous connectez à un groupe d'administration, vous vous connectez à un serveur d'administration pour ce groupe d'administration. Selon la taille de votre environnement informatique, un groupe d'administration peut contenir un seul serveur d'administration ou plusieurs serveurs d'administration.

  • La base de données opérationnelle est une base de données SQL Server qui contient toutes les données de configuration pour le groupe d'administration et stocke toutes les données d'analyse collectées et traitées pour le groupe d'administration. La base de données opérationnelle conserve les données à court terme, par défaut pendant 7 jours.

  • La base de données de l'entrepôt de données est une base de données SQL Server qui stocke les données d'analyse et d'alerte à des fins historiques. Les données qui sont écrites dans la base de données d'Operations Manager sont également écrites dans la base de données de l'entrepôt de données, donc les rapports contiennent toujours les données en cours. La base de données de l'entrepôt de données conserve les données à long terme.

Lorsque la fonctionnalité de création de rapports Operations Manager est installée, le groupe d’administration contient également un serveur de rapports, qui génère et présente des rapports à partir de données dans la base de données de l’entrepôt de données.

Ces composants principaux d'un groupe d'administration peuvent exister sur un serveur unique, ou ils peuvent être distribués sur plusieurs serveurs, comme illustré sur l'image suivante.

Illustration du groupe d’administration de base.

Pour plus d’informations sur l’installation des fonctionnalités de groupe d’administration, consultez le Guide de déploiement d’Operations Manager.

Serveurs d’administration

Le rôle du serveur d'administration consiste à administrer la configuration du groupe d'administration, administrer et communiquer avec les agents et communiquer avec les bases de données du groupe d'administration.

Le groupe d'administration peut contenir plusieurs serveurs d'administration pour fournir d'autres capacités et une disponibilité permanente. Lorsque deux serveurs d'administration ou plus sont ajoutés à un groupe d'administration, les serveurs d'administration deviennent partie intégrante d'un pool de ressources et le travail est réparti entre les membres du pool. En cas de défaillance d'un membre du pool de ressources, les autres membres du pool de ressources intègrent la charge de travail de ce membre. Lorsqu’un nouveau serveur d’administration est ajouté, le nouveau serveur d’administration récupère automatiquement certaines tâches des membres existants dans le pool de ressources. Tous les membres du pool de ressources gèrent un ensemble distinct d’objets distants ; à tout moment, deux membres du même pool ne gèrent pas le même objet en même temps.

Un type spécialisé de serveur d'administration est le serveur de passerelle. Un serveur de passerelle permet d'analyser des ordinateurs dans des domaines non approuvés. Pour plus d’informations, consultez Planification d’une conception de groupe d’administration.

Agents

Un agent Operations Manager est un service qui est installé sur un ordinateur. L’agent collecte des données, compare les exemples de données aux valeurs prédéfinies, crée des alertes et exécute des réponses. Un serveur d'administration reçoit et distribue des configurations aux agents sur des ordinateurs analysés.

Chaque agent dépend d'un serveur d'administration du groupe d'administration. Ce serveur d'administration est appelé serveur d'administration principal de l'agent.

Les agents observent les sources de données sur l'ordinateur analysé et collectent des informations en fonction de la configuration qui leur est envoyée par leur serveur d'administration. L'agent calcule également l'état d'intégrité de l'ordinateur et des objets analysés sur l'ordinateur analysé et le signale au serveur d'administration. Lorsque l’état d’intégrité d’un objet analysé change ou que d’autres critères sont remplis, l’agent peut générer une alerte. Cela permet aux opérateurs de savoir que quelque chose requiert leur attention. En fournissant au serveur d'administration des données d'intégrité sur l'objet analysé, l'agent fournit une image à jour concernant l'intégrité du périphérique et de toutes les applications qu'il héberge.

Un agent peut être configuré pour agir comme un agent proxy. Un agent proxy est un agent qui peut transférer des données à un serveur d'administration pour le compte d'un ordinateur ou d'un périphérique réseau autre que son ordinateur hôte. Par exemple, un agent qui est installé sur le nœud physique d'un cluster SQL peut être activé pour agir en tant que proxy afin d'analyser la ressource de cluster. Les agents proxy activent la surveillance des ordinateurs et des appareils sur lesquels un agent ne peut pas être installé. Pour plus d'informations, consultez Agentless Monitoring (Analyse sans agent).

Services

Sur un ordinateur surveillé, l’agent Operations Manager est répertorié comme service Microsoft Monitoring Agent. Le service Microsoft Monitoring Agent collecte les données de performances, exécute des tâches, et ainsi de suite. Même si le service ne parvient pas à communiquer avec le serveur d'administration dont il dépend, le service continue d'être exécuté et met les données et événements collectés en file d'attente sur le disque de l'ordinateur analysé. Quand la connexion est restaurée, le service Microsoft Monitoring Agent envoie les données collectées et les événements au serveur d’administration.

Remarque

Le service Microsoft Monitoring Agent est parfois appelé service d’intégrité.

Le service Microsoft Monitoring Agent s’exécute également sur des serveurs d’administration. Sur un serveur d’administration, le service exécute des workflows de surveillance et gère les informations d’identification. Pour exécuter des flux de travail, le service lance MonitoringHost.exe processus à l’aide d’informations d’identification spécifiées. Ces processus analysent et collectent les données du journal des événements, les données du compteur de performances, les données de l'infrastructure de gestion Windows (WMI) et exécutent des actions telles que des scripts.

Les serveurs d'administration exécutent également le service d'accès aux données System Center et du service de configuration d'administration System Center.

Le service d'accès aux données System Center fournit un accès pour la console Opérateur à la base de données opérationnelle et écrit des données dans la base de données.

Le service de configuration d'administration System Center gère les relations et la topologie du groupe d'administration. Il distribue également des packs d'administration aux objets analysés.

Packs d’administration

Les flux de travaux exécutés par le service d'administration System Center sont définis par des packs d'administration. Les packs d'administration définissent les informations que l'agent collecte et renvoie au serveur d'administration pour une application ou une technologie spécifique. Par exemple, le pack d'administration de BizTalk Server contient des règles et des analyses qui collectent et évaluent les événements et opérations qui sont importants pour garantir l'intégrité et l'efficacité de l'application BizTalk Server.

Une fois qu'Operations Manager a installé un agent sur un ordinateur, il envoie une configuration initiale à l'agent. La configuration initiale inclut des détection d'objet à partir de packs d'administration. Le pack d’administration définit les types d’objets, tels que les applications et les fonctionnalités qui seront surveillées sur les ordinateurs découverts par Operations Manager. Agents envoient des données au serveur d'administration qui identifie les instances d'objets détectés sur l'ordinateur. Le serveur d'administration envoie ensuite aux agents les éléments de packs d'administration qui s'appliquent aux objets détectés pour chaque ordinateur, tels que de règles et des analyses.

Une règle définit les événements et les données de performances à collecter à partir d’ordinateurs et ce qu’il faut faire avec les informations après sa collecte. Pour simplifier, imaginez une règle comme une instruction if/then (si/alors). Par exemple, un pack d'administration destiné à une application peut contenir les règles suivantes :

  • Si un message indiquant que l'application est en cours d'arrêt est ajouté au journal des événements, créer une alerte.

  • Si le chargement d’un fichier source échoue, collectez l’événement qui indique cet échec.

Comme le montrent ces exemples, les règles peuvent créer des alertes et collecter des événements ou des données de performances que l'agent envoie au serveur d'administration. Elles peuvent également exécuter des scripts, par exemple pour autoriser une règle à tenter de redémarrer une application qui a échoué.

L'état d'intégrité des objets détectés se reflète dans la console Opérateur en vert (réussi ou sain), en jaune (avertissement) ou en rouge (critique ou non intègre). LesAnalyses définissent les états d'intégrité pour les aspects particuliers de l'objet analysé. Par exemple, une analyse de la capacité du disque dur peut définir le vert comme plein à moins de 85 %, le jaune comme plein à plus de 85 % et le rouge comme plein à plus de 90 %. Une analyse peut être configurée pour générer une alerte lorsqu'un changement d'état se produit.

Découvrir et surveiller des objets

L'image suivante est une illustration simplifiée de la façon dont les objets sont détectés et analysés.

Illustration d’une vue d’ensemble de la découverte et de la surveillance.

  1. L'administrateur configure Operations Manager pour qu'il recherche des ordinateurs à gérer. Pour plus d’informations sur la découverte d’ordinateurs, consultez planification du déploiement de l’agent.

  2. Les ordinateurs qui répondent aux critères spécifiés et qui ne sont pas déjà gérés sont identifiés.

  3. Un agent Operations Manager est installé sur l'ordinateur détecté.

  4. L’agent demande des données de configuration, puis le serveur d’administration envoie les données de configuration de l’agent à partir des packs d’administration installés, ce qui inclut les classes à découvrir. Par exemple, si les packs d'administration du système d'exploitation Windows Server sont installés, le serveur d'administration envoie à l'agent les classes du système d'exploitation.

  5. L'agent compare les données de configuration à l'ordinateur, identifie les objets qu'il détecte et renvoie les informations au serveur d'administration. Par exemple, l’agent indiquera au serveur d’administration qu’une instance du système d’exploitation Windows Server 2019 se trouve sur l’ordinateur.

  6. Le serveur d’administration envoie à l’agent toutes les logiques de surveillance à partir des packs d’administration installés qui s’appliquent aux objets découverts. Par exemple, l’agent recevra toute la logique d’analyse qui s’applique à Windows Server 2019.

  7. L'agent applique la logique d'analyse, telle que les règles et les analyses, exécute les flux de travaux et renvoie les données au serveur d'administration.

  8. À mesure que des modifications se produisent pour les objets découverts, tels que les applications ajoutées ou désinstallées, l’agent envoie les informations mises à jour au serveur d’administration, qui envoie ensuite la logique de surveillance mise à jour.

Remarque

Operations Manager peut également découvrir et surveiller des appareils réseau, des ordinateurs exécutant des systèmes d’exploitation UNIX et Linux, et fournir une surveillance sans agent. Pour plus d'informations, consultez Operations Manager Monitoring Scenarios (Scénarios d'analyse d'Operations Manager) dans le guide des opérations.

Communication entre les agents et les serveurs d’administration

L'agent Operations Manager envoie des données d'alerte et de découverte au serveur d'administration principal, qui écrit les données dans la base de données opérationnelle. L'agent envoie également des événements, des performances et des données d'état au serveur d'administration principal pour cet agent, qui écrit les données dans les bases de données opérationnelle et de l'entrepôt de données simultanément.

L'agent envoie des données en fonction des paramètres de planification pour chaque règle et analyse. Pour les règles de collecte optimisées, les données sont transmises uniquement si l'échantillon d'un compteur diffère de l'échantillon précédent par une tolérance spécifiée, par exemple 10 %. Cela permet de réduire le trafic réseau et le volume des données stockées dans la base de données opérationnelle.

En outre, tous les agents envoient un paquet de données, appelé une pulsation, au serveur d'administration à intervalles réguliers, par défaut toutes les 60 secondes. L'objectif de la pulsation est de valider la disponibilité de l'agent et la communication entre l'agent et le serveur d'administration. Pour plus d'informations sur les pulsations, consultez How Heartbeats Work in Operations Manager (Fonctionnement des pulsations dans Operations Manager).

Pour chaque agent, Operations Manager exécute un observateur du service d'intégrité, qui analyse l'état du service d'intégrité à distance du point de vue du serveur d'administration.

Autres ressources pour Operations Manager