Intégrer l’analyse à l’échelle du cloud dans votre stratégie d’adoption du cloud
Créez une stratégie d’adoption du cloud unique et centralisée pour votre organisation à l’aide de la méthodologie de stratégie dans le Cloud Adoption Framework d’Azure. Si vous n’avez pas déjà enregistré votre stratégie d’adoption du cloud, utilisez le modèle de stratégie et de plan.
Cet article contient des considérations relatives aux scénarios d’analyse à l’échelle du cloud qui affectent votre stratégie plus large.
Avant d’implémenter l’analyse à l’échelle du cloud, vous devez disposer d’un plan pour votre stratégie de données. Vous pouvez commencer petit avec un cas d’usage unique, ou vous pouvez disposer d’un ensemble beaucoup plus grand de cas d’usage qui nécessite une hiérarchisation. Avoir une stratégie vous aide à établir vos processus et à déclencher des conversations initiales concernant les piliers sur lesquels vous devez vous concentrer.
Hiérarchiser les résultats métier pour votre stratégie de données
Avoir une stratégie de données réussie vous donne un avantage concurrentiel. Vous devez toujours aligner votre stratégie de données avec vos résultats opérationnels souhaités. La plupart des résultats opérationnels peuvent être classés dans une des quatre catégories suivantes :
Responsabilisation de vos employés : fournissez à votre personnel des connaissances en temps réel sur les clients, les appareils et les machines. Ces connaissances les aident à collaborer efficacement pour répondre aux besoins des clients ou de l’entreprise avec agilité.
Fidélisation des clients : offrez une expérience riche, personnalisée et connectée inspirée par votre marque. Tirez parti de la puissance des données et des insights pour fidéliser les clients à chaque étape d’un parcours client.
Optimisation des opérations : augmentez le flux des informations dans toute votre organisation. Synchronisez vos processus métier et utilisez une approche pilotée par les données pour rendre chaque interaction précieuse.
Transformez vos produits et votre cycle de vie de développement : recueillez des données de télémétrie sur vos services et vos offres. Utilisez les données de télémétrie pour classer par ordre de priorité une version ou créer une nouvelle fonctionnalité, et évaluez l’efficacité et l’adoption en continu.
Une fois que vous avez classé vos résultats opérationnels par ordre de priorité, examinez vos projets actuels et vos initiatives stratégiques à long terme, puis classez-les en conséquence. Envisagez de combiner les quatre catégories de résultats opérationnels sous forme de tableau en fonction de la complexité et de l’impact. Envisagez également d’ajouter des piliers architecturaux pour vous aider à approfondir votre scénario.
Dévoiler la valeur stratégique
Il existe des complexités et des réalités du terrain inhérentes lors de la création d’une culture orientée données pour faire croître l’entreprise d’une manière cohérente, directe, agile et informée. Avant d’entrer dans votre phase de déploiement, concentrez-vous sur la formation d’une stratégie de données cohérente qui peut vous aider à atteindre vos résultats opérationnels souhaités.
Les analyses à l’échelle du cloud sont alignées sur les motivations axées sur l’innovation. Les clients qui intègrent ce scénario dans leur stratégie d’adoption cloud sont motivés par les facteurs courants suivants :
- Une infrastructure d’analyse évolutive, qui vous permet de créer une plateforme de données d’entreprise
- Le libre-service, qui autonomise les utilisateurs dans l’exploration des données, la création de ressources de données et le développement de produits
- Une culture axée sur les données avec des ressources de données réutilisables, des communautés de données, un échange sécurisé tiers et un partage sur place
- Le partage des données avec confiance en utilisant des stratégies, une identité commune, la confidentialité et le chiffrement
- Expériences client et engagements améliorés
- Transformation de produits ou de services
- Lancement sur le marché de nouveaux produits ou services
Le diagramme suivant contient des thèmes clés pour vous aider à réaliser ces motivations dans votre propre stratégie. Analysez soigneusement ces thèmes, ainsi que la façon dont ils contribuent à une stratégie de données cohérente. Réfléchissez également à la façon dont elles peuvent déverrouiller la valeur stratégique de vos données, permettant une croissance cohérente de l’entreprise.
« Une stratégie de données constitue la base pour utiliser les données comme un atout et faire progresser l'entreprise. Il ne s'agit pas d'une solution de fortune aux problèmes de données. Il s'agit d'un plan directeur à long terme qui définit les personnes, les processus et la technologie à mettre en place pour résoudre les défis liés aux données ».
La création de votre stratégie est une première étape. L’exécution de votre stratégie à l’échelle de l’entreprise constitue un défi de taille par rapport aux choix de votre organisation concernant la culture, les personnes, les processus et les technologies. Cette exécution demande un engagement et une appropriation claire à tous les niveaux de votre organisation.
Amélioration de l’efficacité
L’agilité du cloud oblige les organisations à s’adapter rapidement et à apporter de l’efficacité dans tous les domaines de l’entreprise. Selon le rapport sur les risques émergents de Gartner, bien que les organisations continuent de se concentrer et d’investir dans des initiatives numériques, les deux tiers de ces organisations présentent des faiblesses d’entreprise et ne parviennent pas à répondre aux attentes.
Opérationnaliser la gestion des données
De nombreuses organisations décentralisent progressivement l’informatique centrale pour permettre l’agilité. Les organisations veulent innover rapidement, et l’accès aux données unifiées en libre-service à l’échelle de l’entreprise peut leur permettre de répondre à des exigences métier complexes.
Il existe de nombreuses raisons pour lesquelles les entreprises ne peuvent pas exploiter pleinement le potentiel de leurs données. Cela peut être dû au fait que les fonctions d’entreprise fonctionnent dans des silos, où chaque équipe utilise différents outils et normes pour l’analyse des données. Il peut aussi s’agir d’une incapacité à associer les indicateurs de performance clés aux objectifs métier généraux.
La démocratisation des données vous permet de redonner cette valeur à l’entreprise et d’atteindre les objectifs de croissance métier complexes.
- Comprenez et hiérarchisez vos besoins en matière d’applications métier.
- Distribuez vos données entre les domaines pour permettre la propriété et rapprocher les données des utilisateurs.
- Déployez des produits de données en libre-service pour générer des insights et une valeur commerciale.
Pour la gouvernance des données, vous devez trouver un équilibre approprié dans le monde décentralisé d’une démocratisation des données. Si vous appliquez trop strictement la gouvernance, vous pouvez freiner l’innovation. Toutefois, si vous n’avez pas mis au moins certains principes et processus fondamentaux en place, vous risquez de vous retrouver avec des silos de données. Ces silos peuvent nuire à la réputation et aux revenus potentiels de votre organisation. Une approche holistique de la gouvernance des données est essentielle pour que vous puissiez déverrouiller la valeur stratégique de vos données de façon cohérente.
L’absence d’une stratégie de données bien pensée conduit à un besoin de « se lancer » et de commencer rapidement à valoriser votre organisation. Résolvez les problèmes métier actuels en agissant sur les thèmes clés mentionnés précédemment ou en les utilisant comme principes stratégiques au sein d’une infrastructure. L’utilisation de ces thèmes clés peut également vous aider à créer une stratégie de données holistique itérative avec validation, tout en fournissant des résultats opportuns. Les responsables commerciaux et technologiques doivent développer les stratégies et l’état d’esprit nécessaires pour générer de la valeur à partir des données et les adapter rapidement de façon structurée et simplifiée
Pour plus d'informations, consultez Présentation de la gouvernance des données.
Développer une culture pilotée par les données
Pour créer une stratégie de données réussie, vous avez besoin d’une culture pilotée par les données. Développez une culture qui favorise la participation collaborative et ouverte de manière cohérente. Dans ce type de culture, l’ensemble du personnel peut apprendre, communiquer et améliorer les résultats commerciaux de l’organisation. Le développement d’une culture pilotée par les données améliore également la capacité de chaque employé à générer un impact ou une influence basés sur les données.
Le point de départ de votre parcours dépend de votre organisation, de votre secteur d’activité et de votre emplacement actuel le long de la courbe de maturité. Le diagramme suivant présente un exemple de modèle de maturité décrivant les niveaux de maturité de l’utilisation de l’IA d’une organisation :
Niveau 0
Les données ne sont pas exploitées de manière programmatique et cohérente. Au sein de l’entreprise, l’accent est mis sur les données du point de vue du développement des applications.
Au niveau 0, l’organisation a souvent des projets d’analyse non planifiés. Chaque application est hautement spécialisée en fonction des données uniques et des besoins des parties prenantes. Chaque application dispose également de bases de code et d’équipes d’ingénierie importantes, et beaucoup sont conçues en dehors du secteur informatique. L’activation et l’analyse de cas d’usage sont cloisonnées.
Niveau 1
Au niveau 1, des équipes se forment et une stratégie se crée, mais l’analyse est toujours compartimentée. L’organisation est généralement bonne dans la capture et l’analyse des données traditionnelles. Elle peut avoir un certain niveau d’engagement pour une approche à l’échelle du cloud. Par exemple, elle peut déjà accéder aux données à partir du cloud.
Niveau 2
La plateforme d’innovation de l’organisation est presque prête. Les workflows sont en place pour traiter la qualité des données. L’organisation peut répondre à quelques « pourquoi ».
Au niveau 2, l’organisation recherche activement une stratégie de données de bout en bout qui utilise des magasins de lac de données gérés de manière centralisée pour contrôler la prolifération des magasins de données et améliorer la détectabilité des données. L’organisation est prête à accueillir des applications intelligentes qui apportent des calculs aux lacs de données gérés de manière centralisée. Ces applications intelligentes réduisent les risques de confidentialité, les coûts de calcul et le besoin de copies fédérées de données importantes.
À ce niveau, l’organisation est aussi prête à utiliser des services de données partagées, hébergées de manière centralisée et multilocataires pour les tâches de calcul de données courantes. Ces services de données partagées permettent de bénéficier d’insights rapides à partir des services intelligents pilotés par la science des données.
Niveau 3
L’organisation utilise une approche holistique des données. Les projets liés aux données sont intégrés aux résultats commerciaux. L’organisation utilise des plateformes d’analytique pour faire des prédictions.
Au niveau 3, l’organisation libère l’innovation numérique tant du point de vue du patrimoine de données que du développement d’applications. Les services de données de base sont en place, notamment les lacs de données et les services de données partagées.
Plusieurs équipes dans l’ensemble de l’organisation réussissent à fournir des charges de travail critiques, des cas d’utilisation clés et des résultats mesurables. Les nouveaux services de données partagés sont identifiés à l’aide de données de télémétrie. Le service informatique constitue un conseiller de confiance pour les équipes de toute l’entreprise grâce à une stratégie de données fiables et connectées de bout en bout afin d’aider à améliorer les processus d’entreprise essentiels.
Niveau 4
Au niveau 4, l’ensemble de l’organisation utilise des frameworks, des normes d’entreprise et une culture pilotée par les données. L’automatisation, les boucles de rétroaction pilotées par les données et les centres d’excellence liés à l’analyse ou à l’automatisation peuvent être observés en action.
Développer des objectifs en phase avec l’entreprise
L’identification des priorités en phase avec la vision de l’entreprise et la mise en application de l’idéologie « Penser grand, commencer petit et agir vite » sont les clés du succès. La sélection du bon cas d’usage ne doit pas nécessairement être un processus de vérification difficile et long. Il peut s’agir d’un problème en cours dans une unité commerciale où il y a suffisamment de données pour valider son retour sur investissement, un engouement accru et la facilité d’acceptation. Les choses peuvent bouger rapidement et c’est là que la plupart des entreprises peuvent éprouver des difficultés à démarrer.
Comprendre les attributs de données
Pour créer une stratégie de données forte, vous devez comprendre le fonctionnement des données. La connaissance des caractéristiques de base des données vous permet de développer une pratique fondée sur des principes en lien avec le traitement des données.
Les données voyagent rapidement, mais leur vélocité ne peut pas contrer les lois de la physique. Les données doivent se conformer aux réglementations du pays et de l’industrie qui les ont créées.
Les données ne changent pas d’elles-mêmes, mais elles sont sujettes à des modifications et à des pertes accidentelles, à moins que vous ne mettiez en place des mesures pour atténuer ces problèmes. Mettez en place des mesures de lutte contre la corruption des contrôles, des bases de données et du stockage afin de gérer les changements imprévus. Vérifiez également que vous avez configuré la surveillance, les audits, les alertes et les processus en aval.
En soi, les données ne produisent pas d’insights ou de valeur. Pour obtenir des insights ou extraire de la valeur, vous devez disposer la plupart ou l’ensemble de vos données en quatre étapes discrètes :
- Ingestion
- Stockage
- Traitement en cours
- Analytics
Chacune de ces quatre étapes a ses propres principes, processus, outils et technologies.
La retenue des ressources de données et des insights associés peut avoir un impact sur les décisions socio-économiques, politiques, de recherche et d’investissement. Il est essentiel que votre organisation soit capable de fournir des insights de manière sécurisée et responsable. Toutes les données générées ou acquises doivent passer par un exercice de classification des données, sauf indication contraire explicite. Le chiffrement constitue la référence en matière de gestion des données confidentielles au repos et en transit.
Les données, les applications et les services ont tous leurs propres forces gravitationnelles, mais les données ont la force la plus grande. Contrairement à la pomme légendaire de Sir Isaac Newton, les données n’ont aucune masse physique qui affecte les objets environnants. Elles présentent plutôt une latence et un débit, qui agissent comme des accélérateurs pour votre processus d’analyse. La latence, le débit et la facilité d’accès nécessitent souvent une duplication des données, même lorsque cela n’est pas souhaitable. Configurez vos employés, processus, outils et technologies de manière appropriée pour équilibrer ces exigences par rapport aux stratégies de données de votre organisation.
Les constructions architecturales régissent la vitesse à laquelle vous pouvez traiter les données. Les constructions sont facilitées par le biais d’innovations logicielles, matérielles et réseau. Voici quelques considérations architecturales :
- Configuration de la distribution des données
- Partitionnement
- Technologies de cache
- Traitement par lots ou traitement par flux
- Équilibre entre le traitement back-end et le traitement côté client
Définir votre stratégie de données
L’utilisation de données pour créer de meilleurs produits et des services de plus grande valeur constituant un avantage compétitif n’a rien de nouveau. Ce qui est nouveau, ce sont le volume, la vélocité et la variété des données qu’a permis le cloud computing.
La conception d’une plateforme d’analytique données moderne dans le cloud comprend la sécurité, la gouvernance, la surveillance, la mise à l’échelle à la demande, les opérations sur les données et le libre-service. La compréhension de l’interaction entre ces facettes est ce qui distingue une très bonne stratégie de données d’une stratégie correcte. Utilisez des outils tels que le Cloud Adoption Framework pour garantir la cohérence architecturale, l’intégrité et les meilleures pratiques.
Pour être efficace, votre stratégie de données doit contenir des dispositions pour la gouvernance des données. Le diagramme suivant montre les principales phases d’un cycle de vie des données, avec la gouvernance des données comme objectif principal :
Les sections suivantes décrivent les considérations à utiliser lors de la prise de décision concernant les couches de la stratégie de données de principes de conception. Concentrez-vous sur l’apport de résultats opérationnels et de valeur à partir de vos données.
Ingestion de données
L’une des principales considérations relatives à l’ingestion des données est la possibilité de créer rapidement un pipeline de données, des prérequis à la production, de manière sécurisée et conforme. Les éléments importants incluent des technologies pilotées par les métadonnées, libre-service et à faible code pour hydrater votre lac de données.
Lors de la création de pipelines, prenez en compte la conception et votre capacité à faire du data wrangling, à distribuer des données et à mettre à l’échelle le calcul. Vous devez également vous assurer que vous disposez du support DevOps approprié pour l’intégration continue et la livraison de votre pipeline.
Des outils comme Azure Data Factory prennent en charge une multitude de sources de données locales, de sources de données SaaS et de sources de données d’autres clouds publics.
Stockage
Catégorisez et organisez vos données dans des couches physiques et logiques. Les lacs de données font partie de toutes les architectures d’analytique données modernes. Votre organisation doit appliquer les exigences appropriées en matière de confidentialité, de sécurité et de conformité des données pour répondre aux prérequis de classification des données et de conformité du secteur auxquels vous êtes soumis. Le catalogage et le libre-service permettent la démocratisation de données au niveau de l’organisation, stimulant votre innovation tout en étant guidé par le contrôle d’accès approprié.
Choisissez le stockage adapté pour votre charge de travail. Même si vous n’obtenez pas exactement le bon stockage la première fois, le cloud vous permet de basculer rapidement et de redémarrer votre parcours. Utilisez les exigences de votre application pour choisir la meilleure base de données. Veillez à prendre en compte votre capacité à traiter les données en lots et en streaming lorsque vous choisissez une plateforme d’analyse.
Traitement des données
Vos besoins en matière de traitement des données varient selon la charge de travail. La plupart des traitements de données à grande échelle contiennent des éléments de traitement en temps réel et par lots. La plupart des entreprises ont également des éléments d’exigences en ce qui concerne le traitement de séries chronologiques et le besoin de traiter du texte en forme libre pour les fonctionnalités de recherche d’entreprise.
Les exigences de traitement organisationnel les plus populaires proviennent du traitement transactionnel en ligne (OLTP). Certaines charges de travail nécessitent un traitement spécialisé, comme le calcul haute performance (HPC), parfois appelé « Big Compute ». Ces charges de travail résolvent des tâches mathématiques complexes en utilisant un grand nombre d’ordinateurs basés sur CPU ou GPU.
Pour certaines charges de travail spécialisées, les clients peuvent sécuriser les environnements d’exécution tels que l’informatique confidentielle Azure, ce qui permet aux utilisateurs de sécuriser les données pendant qu’elles sont utilisées dans les plateformes de cloud public. Cet état est requis pour un traitement efficace. Les données sont protégées dans un environnement d’exécution de confiance (TEE), également appelé enclave. Un environnement TEE protège le code et les données contre les visualisations et modifications externes. Les environnements TEE vous permettent d’entraîner des modèles d’IA sans sacrifier la confidentialité des données, même si vous utilisez des sources de données provenant de différentes organisations.
Traitement analytique
La construction ETL (extraction, transformation et chargement) est associée aux besoins de traitement analytique en ligne (OLAP) et d’entreposage de données. Un modèle de données et un modèle sémantique alignés sur l’entreprise permettant aux organisations d’implémenter des règles d’entreprise et des indicateurs de performance clés (KPI) sont souvent implémentés dans le cadre du processus analytique. Une fonctionnalité utile est la détection automatique de dérive de schéma.
Résumé de la stratégie de données
L’adoption d’une approche fondée sur des principes en tenant compte de considérations supplémentaires, telles que la gouvernance des données et l’IA responsable, se révélera payante sur le long terme.
Chez Microsoft, nous suivons quatre principes fondamentaux : impartialité, fiabilité/sécurité, confidentialité/sécurité et inclusivité. Les deux principes fondamentaux que sont la transparence et la responsabilité soutiennent ces quatre principes.
Nous mettons nos principes et l’IA responsable en pratique en développant des ressources et un système de gouvernance. Certaines de nos directives portent sur l’interaction homme-IA, l’IA conversationnelle, la conception inclusive, une liste de contrôle d’impartialité de l’IA et une fiche technique pour les jeux de données.
Nous avons également développé un ensemble d’outils pour aider les autres utilisateurs à comprendre, protéger et contrôler l’intelligence artificielle à chaque étape de l’innovation. Ces outils sont le résultat d’efforts de collaboration entre différentes disciplines pour renforcer et accélérer l’IA responsable. Cette collaboration englobe l’ingénierie et le développement de logiciels, les sciences sociales, la recherche utilisateur, le juridique et la stratégie.
Pour améliorer la collaboration, nous avons mis un grand nombre d’outils en open source, comme InterpretML et Fairlearn. D’autres peuvent contribuer à ces outils open source et s’en servir comme base. Nous avons également démocratisé les outils avec Azure Machine Learning.
Le point de pivot pour devenir une organisation orientée données est fondamental pour offrir un avantage concurrentiel dans la nouvelle normalité. Nous souhaitons aider nos clients à passer d’une approche d’application seule à une approche d’application et pilotée par les données. Une approche axée sur les applications et les données peut aider à créer une stratégie de données de bout en bout qui garantit la répétabilité et la scalabilité pour les cas d’usage actuels et futurs qui affectent les résultats de l’entreprise.
Favoriser l’implication, la communication et l’engagement
Tous les rôles clés impliqués dans la réussite de votre stratégie de données doivent comprendre clairement votre approche adoptée et les objectifs commerciaux communs. Vos rôles clés peuvent inclure une équipe de direction (niveau C), des unités commerciales, et des équipes informatiques, d’exploitation et de livraison.
La communication est l’une des parties les plus importantes de cette infrastructure. Votre organisation doit concevoir un processus pour communiquer efficacement entre les rôles. La communication vous aide à gagner en efficacité dans le contexte de votre projet actuel. Elle établit aussi un forum pour permettre à toutes les personnes impliquées de rester en phase, à jour et axées sur l’objectif général de développer une stratégie de données holistique pour votre avenir.
L’engagement est essentiel entre les deux groupes suivants :
- Les membres de l’équipe qui conçoivent et implémentent la stratégie de données
- Les membres de l’équipe qui contribuent, consomment et exploitent les données, (comme les divisions qui prennent les décisions et génèrent des résultats basés sur les données)
En d’autres termes, les stratégies de données et les plateformes de données associées qui sont créées sans engagement de la part des utilisateurs risquent de poser des problèmes de pertinence et d’adoption.
Voici deux processus stratégiques qui vous aideront à réussir dans cette infrastructure :
- Formation d’un centre d’excellence
- Adoption d’une méthode de livraison agile
Pour plus d’informations, consultez Développer un plan pour l’analyse à l’échelle du cloud.
Offrir de la valeur
Lorsque vous livrez des produits de données en cohérence avec les critères de réussite de manière standardisée et structurée, cette livraison valide votre infrastructure itérative. En outre, l’utilisation de votre apprentissage pour innover de manière continue vous aide à renforcer la confiance des entreprises et à élargir les objectifs de stratégie de données. Ce processus offre une adoption plus claire et plus rapide au sein de votre organisation.
Cela s’applique également à votre plateforme de données. Lorsque vous disposez d’une configuration où plusieurs équipes travaillent de manière assez autonome, vous devez vous tourner vers un maillage. Y parvenir constitue un processus itératif. Dans de nombreux cas, cela nécessite d’apporter des modifications importantes à la configuration, à la préparation et à l’alignement métier de votre organisation
Étapes suivantes
Lisez les articles suivants pour trouver des conseils pour votre parcours d’adoption du cloud et réussir votre scénario d’adoption du cloud :