Introduction à l’analytique à l’échelle du cloud pour les industries réglementées
L’analyse à l’échelle du cloud s’appuie sur les zones d’atterrissage Azure pour faciliter le déploiement et la gouvernance. Le principal objectif d’une zone d’atterrissage Azure est de veiller à ce que, quand une application ou une charge de travail atterrit sur Azure, l’infrastructure requise soit déjà en place. Avant de déployer votre zone d’atterrissage analytique à l’échelle du cloud, vous devez avoir déjà suivi le cadre d’adoption du cloud pour déployer une architecture de zone d’atterrissage Azure avec des zones d’atterrissage de la plateforme.
Pour les charges de travail souveraines, Microsoft propose la zone d’atterrissage souveraine (SLZ), qui est une variante de la zone d’atterrissage Azure à l’échelle de l’entreprise, destinée aux organisations nécessitant des contrôles souverains avancés. L’analytique à l’échelle du cloud peut être déployée sur cette variante de la zone d’atterrissage Azure.
L’analytique à l’échelle du cloud implique le déploiement dans des zones d’atterrissage d’applications. Ces zones résident généralement sous le groupe d’administration de la zone d’atterrissage, avec des politiques qui se répercutent sur les modèles d’exemple fournis par Microsoft.
Pour vous aider à démarrer, Microsoft fournit des exemples de modèles que vous pouvez utiliser pour les déploiements de data lakehouse et de maillage de données.
Évaluation de l’analyse à l’échelle du cloud
Souvent, une entreprise recherche la clarté ou des instructions normatives avant de commencer à définir les détails techniques d’un cas d’usage spécifique, d’un projet ou d’une analyse à l’échelle du cloud de bout en bout. Lorsqu’une entreprise formule sa stratégie globale de données, il peut être difficile de s’assurer que tous les principes stratégiques et requis dans l’étendue de l’utilisation actuelle sont pris en compte.
Pour accélérer la mise en place de ce parcours d’insights de bout en bout tout en gardant ces défis à l’esprit, Microsoft a développé un scénario normatif pour l’analyse à l’échelle du cloud. Il s’aligne sur les principaux thèmes traités dans Développer un plan pour l’analyse à l’échelle du cloud.
L’analyse à l’échelle du cloud s’appuie sur le Cloud Adoption Framework de Microsoft et applique le filtre d’infrastructure Microsoft Azure Well-Architected. Microsoft Cloud Adoption Framework fournit des conseils normatifs et les meilleures pratiques sur les modèles d’exploitation du cloud, l’architecture de référence et les modèles de plateforme. Elle est basée sur des enseignements concrets de certains de nos environnements les plus difficiles, sophistiqués et complexes.
L’analyse à l’échelle du cloud ouvre la voie et permet aux clients de créer et de rendre opérationnelles des zones d’atterrissage pour héberger et exécuter des charges de travail d’analyse. Vous créez les zones d’atterrissage sur les bases de la sécurité, de la gouvernance et de la conformité. Elles sont évolutives et modulaires, tout en favorisant l’autonomie et l’innovation.
Historique de l’architecture des données
À la fin des années 1980 a eu lieu l’introduction de l’entrepôt de données 1ère génération, qui combinait des sources de données disparates de l’ensemble de l’entreprise. À la fin des années 2000 est arrivée la 2e génération, avec l’introduction d’écosystèmes Big Data, comme Hadoop et Data Lake. Le milieu des années 2010 a apporté la plateforme de données cloud. Elle était similaire aux générations précédentes, mais avec l’introduction de l’ingestion des données de diffusion en continu, comme les architectures Kappa ou Lambda. Au début des années 2020 ont été introduits les concepts de lac de données, de maillage des données, de fabrique de données et de modèles opérationnels orientés données.
Malgré ces progrès, de nombreuses organisations utilisent toujours la plateforme monolithique centralisée de première génération. Ce système fonctionne bien, jusqu’à un certain point. Toutefois, les goulots d’étranglement peuvent se produire en raison de processus interdépendants, de composants étroitement couplés et d’équipes hyperspecialisées. Les travaux d’extraction, de transformation et de chargement (ETL) peuvent devenir importants et ralentir les délais de livraison.
L’entrepôt de données et le lac de données sont toujours précieux et jouent un rôle important dans votre architecture globale. Dans la documentation qui suit, nous avons mis en évidence certains des problèmes qui peuvent se produire lors de l’utilisation de ces pratiques traditionnelles pour effectuer une mise à l’échelle. Ces défis sont particulièrement pertinents dans une organisation complexe, où les sources de données, les exigences, les équipes et les sorties changent.
Passer à l’analyse à l’échelle du cloud
Votre architecture analytique de données actuelle et votre modèle opérationnel peuvent inclure des structures de data warehouse, data lake et data lakehouse, des structures de data fabric ou de data mesh.
Chaque modèle de données présente ses propres avantages et problèmes. L’analyse à l’échelle du cloud vous aide à travailler à partir de votre configuration actuelle pour modifier votre approche de la gestion des données afin qu’elle puisse évoluer avec votre infrastructure.
Vous pouvez prendre en charge n’importe quels scénario et plateforme de données pour créer une infrastructure d’analyse à l’échelle du cloud de bout en bout servant de base et permettant la mise à l’échelle.
Plateforme de données moderne et résultats souhaités
L’un des principaux domaines d’action consiste à activer votre stratégie de données pour répondre à vos défis en créant de manière itérative une plateforme de données moderne évolutive et agile.
Au lieu d’être submergé par des tickets de service et d’essayer de répondre aux besoins commerciaux concurrents, une plateforme de données moderne vous permet de jouer un rôle plus consultatif en libérant votre temps afin de vous concentrer sur des travaux plus précieux. Vous fournissez des lignes d’entreprise avec la plateforme et les systèmes pour répondre aux besoins des données et d’analyse en libre-service.
Les domaines d’action initiale recommandés sont les suivants :
Améliorez la qualité des données, facilitez l’approbation et obtenez des insights pour prendre des décisions commerciales basées sur les données.
Implémentez en toute transparence des données holistiques, la gestion et l’analyse à grande échelle dans votre organisation.
Établissez une gouvernance robuste des données qui permet le libre-service et la flexibilité pour les secteurs d’activité.
Maintenez la sécurité et la conformité juridique dans un environnement entièrement intégré.
Créez rapidement la base des fonctionnalités d’analyse avancées, avec une solution prête à l’emploi de modèles reproductibles, reproductibles et modulaires.
Régir votre patrimoine analytique
Une deuxième considération consiste à déterminer comment l’organisation implémente la gouvernance des données.
La gouvernance des données vous permet de vous assurer que les données utilisées dans les opérations, les rapports et l’analyse de vos activités sont détectables, exactes, fiables et qu’elles peuvent être protégées.
Dans de nombreuses entreprises, on s’attend à ce que les données et l’intelligence artificielle entraînent un avantage concurrentiel. Par conséquent, les dirigeants sont désireux de parrainer des initiatives d’IA dans leur détermination à devenir axés sur les données. Cependant, pour que l’intelligence artificielle devienne effective, les données qu’elle utilise doivent être fiables. Dans le cas contraire, l’exactitude des décisions peut être compromise, les décisions risquent d’être retardées ou des actions manquées, ce qui peut affecter les résultats. Les entreprises ne veulent pas que la qualité de leurs données soit erronée (garbage in, garbage out). Au début, il peut sembler simple de corriger la qualité des données, jusqu’à ce que vous constatiez l’effet que la transformation numérique a eu sur les données.
Avec des données réparties dans un environnement multicloud hybride et un paysage de données distribuées, les organisations éprouvent des difficultés à trouver leurs données et à les gérer. Les données non gérées peuvent avoir un impact considérable sur l’activité. Une mauvaise qualité des données affecte les opérations de l’entreprise, car les erreurs de données entraînent des erreurs et des retards de traitement. Une mauvaise qualité des données affecte également la prise de décision de l’entreprise et la possibilité de rester conforme. Assurez-vous que la qualité des données à la source est souvent préférée, car la résolution des problèmes de qualité dans le système analytique peut être plus complexe et coûteuse que l’application de règles de qualité des données au début de la phase d’ingestion. Pour faciliter le suivi et la gestion de l’activité des données, la gouvernance des données doit inclure les éléments suivants :
- Découverte de données
- Qualité des données
- Création d’une stratégie
- Partage des données
- Métadonnées
Sécuriser votre patrimoine analytique
Un autre moteur majeur pour la gouvernance des données est la protection des données. La protection des données peut vous aider à respecter la législation réglementaire et à empêcher les violations de données. La confidentialité des données, ainsi que le nombre croissant de violations de données, ont fait de la protection des données une priorité absolue dans les salles de réunion. Ces violations mettent en évidence le risque associé aux données sensibles, telles que les données client personnellement identifiables. Les conséquences d’une violation de la confidentialité des données ou de leur sécurité sont nombreuses et peuvent inclure :
- Perte ou dommages sérieux à l’image de marque
- Perte de la confiance des clients et de parts de marché
- Baisse du cours de l’action, ce qui affecte le retour sur investissement des parties prenantes et le salaire des dirigeants
- Pénalités financières importantes en raison d’un échec d’audit ou d’une non-conformité
- Action légale
- L’effet domino de la violation, par exemple, les clients peuvent être victimes d’une usurpation d’identité
Dans la plupart des cas, les sociétés cotées en bourse doivent déclarer ces violations. Si des violations se produisent, les clients sont plus enclins à blâmer l’entreprise en premier plutôt que le pirate. Le client peut boycotter l’entreprise pendant plusieurs mois ou ne plus jamais y retourner.
Le non-respect de la législation réglementaire en matière de confidentialité des données peut entraîner des pénalités financières importantes. L’administration de vos données vous aidera à éviter de tels risques.
Modèle d’exploitation et avantages
L’adoption d’une plateforme de stratégie de données moderne ne modifie pas seulement la technologie utilisée par votre organisation, mais aussi la façon dont elle fonctionne.
L’analyse à l’échelle du cloud fournit des conseils prescrits pour vous aider à prendre en compte la façon d’organiser et de qualifier votre personnel et vos équipes, notamment :
- Définitions de personnage, de rôle et de responsabilité
- Structures suggérées pour les équipes agiles, verticales et inter-domaines
- Ressources de compétences, y compris les données Azure et les certifications d’IA via Microsoft Learn
Il est également important d’engager vos utilisateurs finaux tout au long du processus de modernisation, et à mesure que vous continuez à faire évoluer votre plateforme et à intégrer de nouveaux cas d’usage.
Architectures
Les zones d’atterrissage Azure représentent le chemin de conception stratégique et l’état technique cible de votre environnement. Elles permettent de faciliter le déploiement et la gouvernance afin d’améliorer l’agilité et la conformité. Les zones d’atterrissage Azure garantissent également que, lorsqu’une nouvelle application ou charge de travail atterrit dans votre environnement, l’infrastructure appropriée est déjà en place. Les zones de gestion des données Azure et les zones d’atterrissage des données, intégrées aux solutions de gouvernance et d’analytique en tant que service de Microsoft, sont conçues en tenant compte de ces mêmes principes fondamentaux et, lorsqu’elles sont combinées avec les autres éléments de l’analytique à l’échelle du cloud, peuvent contribuer à activer :
- Libre-service
- Extensibilité
- Démarrage rapide
- Sécurité
- Confidentialité
- Opérations optimisées
Zone d'atterrissage de gestion de données
La zone d’atterrissage de gestion des données constitue la base de la gouvernance et de la gestion centralisées des données de votre plateforme au sein de votre organisation. Elle facilite également la communication pour ingérer des données à partir de l’ensemble de votre patrimoine numérique, y compris l’infrastructure multicloud et hybride.
La zone d’atterrissage de gestion des données prend en charge de nombreuses autres fonctionnalités de gestion et de gouvernance des données, telles que :
- Data Catalog
- Gestion de la qualité des données
- Classification des données
- Traçabilité des données
- Référentiel de modélisation des données
- Catalogue d’API
- Partage de données et contrats
Conseil
Si vous utilisez des solutions partenaires pour les capacités de catalogue de données, de gestion de la qualité des données ou de traçabilité des données, elles devraient résider dans la zone d’atterrissage de gestion des données. Alternativement, Microsoft Purview peut être déployé en tant que solution de logiciel en tant que service, se connectant à la fois à la zone d’atterrissage de gestion des données et aux zones d’atterrissage des données.
Zones d’atterrissage des données
Les zones d’atterrissage des données rapprochent les données des utilisateurs et permettent le libre-service, tout en conservant la gestion et la gouvernance courantes via la connexion à la zone d’atterrissage de gestion des données.
Elles hébergent des services standard tels que la mise en réseau, la surveillance, l’ingestion et le traitement des données, ainsi que des personnalisations telles que les produits de données et les visualisations.
Les zones d’atterrissage des données sont essentielles pour permettre la scalabilité de votre plateforme. Selon la taille et les besoins de votre organisation, vous pouvez commencer par une ou plusieurs zones d’atterrissage.
Lorsque vous décidez entre les zones d’atterrissage uniques et multiples, tenez compte des dépendances régionales et des exigences en matière de résidence des données. Par exemple, existe-t-il des lois ou réglementations locales qui exigent que les données restent dans un emplacement spécifique ?
Quelle que soit votre décision initiale, vous pouvez ajouter ou supprimer des zones d’atterrissage de données si nécessaire. Si vous commencez avec une seule zone d’atterrissage, nous vous recommandons de planifier une extension à plusieurs zones d’atterrissage afin d’éviter les besoins futurs en matière de migration.
Remarque
Lorsque Microsoft Fabric a été déployé, la zone d’atterrissage des données héberge des solutions non basées sur des logiciels en tant que service, telles que des lacs de données et d’autres services de données Azure.
Pour plus d’informations sur les zones d’atterrissage, consultez Zones d’atterrissage Azure pour l’analyse à l’échelle du cloud.
Conclusion
Une fois que vous aurez lu cet ensemble de documentation, en particulier les sections relatives à la gouvernance, la sécurité, l’exploitation et aux meilleures pratiques, nous vous recommandons de configurer un environnement de preuve de concept à l’aide des modèles de déploiement. Ces modèles, ainsi que les conseils d’architecture, vous offrent une expérience pratique avec certaines des technologies Azure et des technologies de logiciel en tant que service de Microsoft. Pour plus d’informations, consultez la Liste de contrôle de prise en main.