Partager via


Présentation de l’analytique à l’échelle du cloud

L’analytique à l’échelle du cloud repose sur les zones d’atterrissage Azure pour simplifier le déploiement et la gouvernance. L’objectif principal d’une zone d’atterrissage Azure est de s’assurer que, lorsque vous déployez une application ou une charge de travail sur Azure, l’infrastructure requise est déjà en place. Avant de déployer votre zone d’atterrissage d’analytique à l’échelle du cloud, vous devez utiliser Cloud Adoption Framework pour Azure pour déployer une architecture de zone d’atterrissage Azure qui a des zones d’atterrissage de plateforme.

Pour les charges de travail souveraines, Microsoft fournit la zone d’atterrissage souverain (SLZ), qui est une variante de la zone d’atterrissage Azure à l’échelle de l’entreprise. Le SLZ est destiné aux organisations qui ont besoin de contrôles souverains avancés. L’analytique à l’échelle du cloud peut être déployée sur cette variante de zone d’atterrissage Azure.

L’analytique à l’échelle du cloud implique le déploiement dans des zones d’atterrissage d’applications. Ces zones résident généralement sous le groupe d’administration des zones d’atterrissage. Les stratégies filtrent jusqu’aux exemples de modèles que Microsoft fournit.

Vous pouvez utiliser ces exemples de modèles pour votre data lakehouse et pour vos déploiements de maillage de données .

Évaluation de l’analyse à l’échelle du cloud

Souvent, une entreprise cherche des conseils clairs ou prescriptifs avant de commencer à définir les détails techniques d’un cas d’usage ou d’un projet spécifique, ou pour l’analytique à l’échelle du cloud de bout en bout. En tant qu’entreprise formule sa stratégie globale de données, il peut être difficile de s’assurer que tous les principes stratégiques et requis dans le cadre de l’utilisation actuelle sont pris en compte.

Pour accélérer la livraison de cette implémentation d’insights de bout en bout, tout en tenant compte de ces défis, Microsoft a développé un scénario prescriptif pour l’analytique à l’échelle du cloud. Il s’aligne sur les thèmes clés abordés dans Développer un plan pour l’analytique à l’échelle du cloud.

L’analytique à l’échelle du cloud s’appuie sur le Framework d’adoption du cloud et applique les principes d’Azure Well-Architected Framework. Le Framework d’adoption du cloud fournit des conseils préscriptifs et des bonnes pratiques pour les modèles d’exploitation cloud, les architectures de référence et les modèles de plateforme. Ce guide est basé sur des expériences réelles de certains de nos environnements les plus difficiles, sophistiqués et complexes.

L’analytique à l’échelle du cloud vous aide à préparer la création et l’opérationnalisation des zones d’atterrissage pour héberger et exécuter des charges de travail d’analyse. Vous créez les zones d’atterrissage sur les bases de la sécurité, de la gouvernance et de la conformité améliorées. Les zones d’atterrissage sont évolutives et modulaires, mais elles prennent en charge l’autonomie et l’innovation.

Historique de l’architecture des données

À la fin des années 1980, la génération 1 de l’entrepôt de données a été introduite. Ce modèle combine des sources de données disparates d’une entreprise. À la fin des années 2000, la génération 2 a émergé, avec l’introduction d’écosystèmes big data comme Hadoop et les lacs de données. Au milieu des années 2010, la plateforme de données cloud a émergé avec l'introduction de l'ingestion de données en streaming par des architectures comme Kappa ou Lambda. Au début des années 2020, des data lakehouses, des maillages de données, des structures de données et des modèles opérationnels centrés sur les données ont été introduits.

Malgré ces progrès, de nombreuses organisations utilisent toujours la plateforme monolithique centralisée : génération 1. Ce système fonctionne bien, jusqu’à un certain point. Toutefois, les goulots d’étranglement peuvent se produire en raison de processus interdépendants, de composants étroitement couplés et d’équipes hyperspecialisées. Les travaux d’extraction, de transformation et de chargement (ETL) peuvent devenir importants et ralentir les délais de livraison.

Les entrepôts de données et les lacs de données sont toujours précieux et jouent un rôle important dans votre architecture globale. La documentation suivante met en évidence certains des défis qui peuvent se produire lorsque vous utilisez ces pratiques traditionnelles pour la mise à l’échelle. Ces défis sont particulièrement pertinents dans une organisation complexe, où les sources de données, les exigences, les équipes et les sorties changent.

Passer à l’analyse à l’échelle du cloud

Votre architecture actuelle de données analytiques et votre modèle d’exploitation peuvent inclure des structures telles que data warehouse, data lake et data lakehouse, une toile de données ou un maillage de données.

Chaque modèle de données présente ses propres avantages et problèmes. L’analytique à l’échelle du cloud vous aide à changer votre approche actuelle de la gestion des données afin qu’elle puisse évoluer avec votre infrastructure.

Vous pouvez prendre en charge n’importe quels scénario et plateforme de données pour créer une infrastructure d’analyse à l’échelle du cloud de bout en bout servant de base et permettant la mise à l’échelle.

Plateforme de données moderne et résultats souhaités

L’une des premières étapes consiste à activer votre stratégie de données pour relever vos défis en créant de manière itérative une plateforme de données moderne évolutive et agile.

Au lieu d’être submergé par les tickets de service et d’essayer de répondre aux besoins d’entreprise concurrents, lorsque vous implémentez une plateforme de données moderne, vous pouvez jouer un rôle plus consultatif, car vous pouvez libérer votre temps pour vous concentrer sur un travail plus précieux. Vous fournissez des lignes d’entreprise avec la plateforme et les systèmes pour répondre aux besoins des données et d’analyse en libre-service.

Voici les domaines recommandés du focus initial :

  • Améliorez la qualité des données, facilitez l’approbation et obtenez des insights pour prendre des décisions commerciales basées sur les données.
  • Implémentez des données holistiques, la gestion et l’analytique à grande échelle au sein de votre organisation.
  • Établissez une gouvernance robuste des données qui permet le libre-service et la flexibilité pour les secteurs d’activité.
  • Maintenez la sécurité et la conformité juridique dans un environnement entièrement intégré.
  • Créez rapidement la base des capacités d'analytique avancée à l’aide d’une solution prête à l’emploi de modèles modulaires et reproductibles bien conçus.

Régir votre patrimoine analytique

Une deuxième considération consiste à déterminer comment votre organisation implémentera la gouvernance des données.

La gouvernance des données est le processus permettant de s’assurer que les données que vous utilisez dans vos opérations métier, les rapports et l’analyse sont détectables, précises, approuvées et qu’elles peuvent être protégées.

Dans de nombreuses entreprises, on s’attend à ce que les données et l’intelligence artificielle entraînent un avantage concurrentiel. Par conséquent, les cadres sont impatients de parrainer des initiatives d’IA dans leur détermination à devenir pilotés par les données. Toutefois, pour que l’IA soit efficace, elle doit utiliser des données approuvées. Sinon, la précision de la décision peut être compromise, les décisions peuvent être retardées ou les actions peuvent être manquées, ce qui peut affecter le résultat. Les entreprises ne veulent pas que la qualité de leurs données soit médiocre. Tant que vous n’avez pas examiné l’effet que la transformation numérique a eu sur les données, il peut sembler simple de corriger la qualité des données.

Les organisations qui ont des données réparties dans un paysage hybride multicloud et distribué-données luttent pour trouver où se trouvent leurs données et les régir. Les données non gouvernementales peuvent avoir un effet considérable sur l’entreprise. Une mauvaise qualité des données affecte les opérations métier, car les erreurs de données provoquent des erreurs de processus et des retards. Une mauvaise qualité des données affecte également la prise de décision métier et la capacité à rester conforme. Garantir la qualité des données à la source est souvent préférable, car la résolution des problèmes de qualité dans le système analytique peut être plus complexe et coûteuse que l’application de règles de qualité des données au début de la phase d’ingestion. Pour vous aider à suivre et à régir l’activité des données, la gouvernance des données doit inclure :

  • Découverte de données.
  • Qualité des données.
  • Création de stratégie.
  • Partage de données.
  • Métadonnées.

Sécuriser votre patrimoine analytique

Un autre moteur majeur pour la gouvernance des données est la protection des données. La protection des données peut vous aider à garantir la conformité à la législation réglementaire et à empêcher les violations de données. La confidentialité des données et le nombre croissant de violations de données ont fait de la protection des données une priorité absolue. Les violations de données mettent en évidence le risque pour les données sensibles, telles que les données client identifiables personnellement. Les conséquences de la violation de la confidentialité des données ou d’une violation de sécurité des données peuvent inclure :

  • Dommages graves à l’image de marque.
  • Perte de confiance des clients et de part de marché.
  • Une réduction du prix des actions, qui affecte le rendement des investissements des parties prenantes et les salaires des dirigeants.
  • Pénalités financières importantes en raison de défaillances d’audit ou de conformité.
  • Action juridique.
  • Les effets secondaires de la violation, par exemple, les clients peuvent être victimes d’un vol d’identité.

Dans la plupart des cas, les sociétés cotées publiquement doivent déclarer des violations. Si des violations se produisent, les clients sont susceptibles de blâmer l’entreprise plutôt que le pirate informatique. Les clients peuvent boycotter l’entreprise pendant plusieurs mois ou ne jamais revenir.

Le non-respect de la législation réglementaire en matière de confidentialité des données peut entraîner des pénalités financières importantes. La gouvernance de vos données vous permet d’éviter ces risques.

Modèle d’exploitation et avantages

L’adoption d’une plateforme de stratégie de données moderne ne modifie pas seulement la technologie utilisée par votre organisation. Elle modifie également le fonctionnement de l’organisation.

L’analytique à l’échelle du cloud fournit des conseils pour vous aider à organiser et à former vos employés, notamment :

  • Définitions de persona, de rôle et de responsabilité.
  • Structures suggérées pour les équipes agiles, verticales et inter-domaines.
  • Ressources de formation, y compris les certifications azure data et IA via Microsoft Learn.

Il est également important d’impliquer vos utilisateurs finaux tout au long du processus de modernisation et de continuer à faire évoluer votre plateforme et à intégrer de nouveaux cas d’usage.

Architectures

Les zones d’atterrissage Azure représentent le chemin de conception stratégique et l’état technique cible de votre environnement. Ils facilitent le déploiement et la gouvernance afin que vous puissiez améliorer l’agilité et la conformité. Ils garantissent également que, lorsqu’une nouvelle application ou une charge de travail est ajoutée à votre environnement, l’infrastructure appropriée est déjà en place. La gestion des données Et les zones d’atterrissage des données Azure, intégrées aux solutions de gouvernance et d’analytique SaaS (Software as a Service) Microsoft, sont conçues avec ces principes fondamentaux à l’esprit et, lorsqu’elles sont combinées avec les autres éléments d’analytique à l’échelle du cloud, peuvent vous aider à activer :

  • Libre-service.
  • Scalabilité.
  • Un démarrage rapide.
  • Sécurité.
  • Vie privée.
  • Opérations optimisées.

Zone d'atterrissage de gestion de données

La zone d’atterrissage de gestion des données constitue la base de la gouvernance et de la gestion centralisées des données de votre plateforme au sein de votre organisation. Il facilite également la communication pour ingérer des données à partir de l’ensemble de votre patrimoine numérique, y compris les infrastructures multiclouds et hybrides.

La zone d’atterrissage de gestion des données prend en charge de nombreuses autres fonctionnalités de gestion et de gouvernance des données, telles que :

  • Catalogues de données.
  • Gestion de la qualité des données.
  • Classification des données.
  • Traçabilité des données.
  • Référentiels de modélisation des données.
  • Catalogues d’API.
  • Partage et contrats de données.

Conseil

Si vous utilisez des solutions partenaires pour les fonctionnalités de catalogue de données, de gestion de la qualité des données ou de traçabilité des données, elles doivent résider dans la zone d’atterrissage de gestion des données. Vous pouvez également déployer Microsoft Purview en tant que solution SaaS, en vous connectant à la fois à la zone d’atterrissage de gestion des données et aux zones d’atterrissage des données.

Zones d’atterrissage des données

Les zones d’atterrissage des données rapprochent les données des utilisateurs et permettent le libre-service, tout en conservant la gestion et la gouvernance courantes via la connexion à la zone d’atterrissage de gestion des données.

Ils hébergent des services standard tels que la mise en réseau, la surveillance et l’ingestion et le traitement des données, en plus des personnalisations telles que les produits de données et les visualisations.

Les zones d’atterrissage des données sont essentielles pour permettre la scalabilité de votre plateforme. Selon la taille et les besoins de votre organisation, vous pouvez commencer par une ou plusieurs zones d’atterrissage.

Lorsque vous choisissez entre des zones d’atterrissage uniques et multiples, tenez compte des dépendances régionales et des exigences de résidence des données. Par exemple, existe-t-il des lois ou réglementations locales qui exigent que les données restent dans un emplacement spécifique ?

Quelle que soit votre décision initiale, vous pouvez ajouter ou supprimer des zones d’atterrissage de données si nécessaire. Si vous commencez par une seule zone d’atterrissage, nous vous recommandons de planifier l’extension à plusieurs zones d’atterrissage afin d’éviter les besoins futurs en matière de migration.

Remarque

Où Microsoft Fabric est déployé, la zone d’atterrissage de données héberge des solutions non SaaS telles que des lacs de données et d’autres services de données Azure.

Pour plus d’informations sur les zones d’atterrissage, consultez Zones d’atterrissage Azure pour l’analyse à l’échelle du cloud.

Conclusion

Après avoir lu ce jeu de documentation, en particulier les sections gouvernance, sécurité, exploitation et bonnes pratiques, nous vous recommandons de configurer un environnement de preuve de concept à l’aide des modèles de déploiement. Ces modèles, ainsi que des conseils d’architecture, vous offrent une expérience pratique avec certaines technologies Azure et Microsoft SaaS. Pour plus d’informations, consultez la Liste de contrôle de prise en main.

Étape suivante