Bonnes pratiques de déploiement de Microsoft Purview (anciennement Azure Purview)
Remarque
Ces meilleures pratiques couvrent le déploiement des solutions de gouvernance Microsoft Purview classiques.
Pour plus d’informations sur le déploiement des nouvelles fonctionnalités de gouvernance des données Microsoft Purview, consultez notre article de démarrage rapide.
Pour plus d’informations sur les solutions de conformité et de risque Microsoft Purview, accédez ici. Pour plus d’informations sur Microsoft Purview en général, accédez ici.
Cet article est un guide pour déployer Correctement Microsoft Purview (anciennement Azure Purview) en production dans votre patrimoine de données. Il est destiné à vous aider à élaborer des stratégies et à mettre en phase votre déploiement de la recherche au renforcement de votre environnement de production. Il est préférable de l’utiliser en tandem avec notre liste de vérification du déploiement.
Si vous recherchez un guide de déploiement strictement technique, utilisez la liste de contrôle du déploiement.
Si vous créez un plan de déploiement de Microsoft Purview et que vous souhaitez prendre en compte les meilleures pratiques à mesure que vous développez votre stratégie de déploiement, suivez l’article ci-dessous. Ce guide décrit les tâches qui peuvent être effectuées par phases au cours d’un mois ou plus pour développer votre processus de déploiement pour Microsoft Purview. Même les organisations qui ont déjà déployé Microsoft Purview peuvent utiliser ce guide pour s’assurer qu’elles tirent le meilleur parti de leur investissement.
Un déploiement bien planifié de votre plateforme de gouvernance peut offrir les avantages suivants :
- Meilleure découverte des données
- Collaboration analytique améliorée
- Retour sur investissement maximal
Ce guide fournit des informations sur un cycle de vie de déploiement complet, de la planification initiale à un environnement mature en suivant ces étapes :
Phase | Description |
---|---|
Identifier les objectifs et les objectifs | Tenez compte de ce que l’ensemble de votre organization souhaite et a besoin de la gouvernance des données. |
Collecte de questions | Quelles sont les questions que vous et votre équipe pourriez avoir au début, et où pouvez-vous chercher pour commencer à y répondre ? |
Créer un processus pour passer en production | Créez une stratégie de déploiement par phases adaptée à votre organization. |
Renforcement de la plateforme | Continuez à développer votre déploiement jusqu’à maturité. |
La plupart des applications et fonctionnalités de Microsoft Purview ont également leurs propres pages de meilleures pratiques individuelles. Ils sont souvent référencés tout au long de ce guide de déploiement, mais vous pouvez tous les trouver dans la table des matières sous Concepts , puis Meilleures pratiques et instructions.
Identifier les objectifs et les objectifs
De nombreuses organisations ont commencé leur parcours de gouvernance des données en développant des solutions individuelles qui répondent aux exigences spécifiques des groupes isolés et des domaines de données dans l’organization. Bien que les expériences puissent varier en fonction du secteur, du produit et de la culture, la plupart des organisations ont du mal à maintenir des contrôles et des stratégies cohérents pour ces types de solutions.
Voici quelques-uns des objectifs courants de gouvernance des données que vous pouvez identifier dans les premières phases pour créer une expérience complète de gouvernance des données :
- Optimisation de la valeur métier de vos données
- Activation d’une culture des données dans laquelle les consommateurs de données peuvent facilement trouver, interpréter et approuver les données
- Amélioration de la collaboration entre différentes unités commerciales pour fournir une expérience de données cohérente
- Favoriser l’innovation en accélérant l’analytique des données pour tirer parti des avantages du cloud
- Réduction du temps de découverte des données par le biais d’options en libre-service pour différents groupes de compétences
- Réduction du délai de commercialisation pour la livraison de solutions d’analytique qui améliorent le service à leurs clients
- Réduction des risques opérationnels dus à l’utilisation d’outils spécifiques à un domaine et de technologies non prises en charge
L’approche générale consiste à décomposer ces objectifs généraux en différentes catégories et objectifs. En voici quelques exemples :
Catégorie | Objectif |
---|---|
Découverte | Administration utilisateurs doivent être en mesure d’analyser les sources de données Azure et non Azure (y compris les sources locales) pour collecter automatiquement des informations sur les ressources de données. |
Classification | La plateforme doit classer automatiquement les données en fonction d’un échantillonnage des données et autoriser le remplacement manuel à l’aide de classifications personnalisées. |
Modèle de consommation | Les utilisateurs professionnels doivent être en mesure de trouver des informations sur chaque ressource pour les métadonnées métier et techniques. |
Traçabilité | Chaque ressource doit afficher une vue graphique des jeux de données sous-jacents afin que les utilisateurs comprennent les sources d’origine et les modifications qui ont été apportées. |
Collaboration | La plateforme doit permettre aux utilisateurs de collaborer en fournissant des informations supplémentaires sur chaque ressource de données. |
Reporting | Les utilisateurs doivent être en mesure d’afficher les rapports sur le patrimoine de données, y compris les données sensibles et les données qui nécessitent un enrichissement supplémentaire. |
Gouvernance des données | La plateforme doit permettre à l’administrateur de définir des stratégies de contrôle d’accès et d’appliquer automatiquement l’accès aux données en fonction de chaque utilisateur. |
Flux de travail | La plateforme doit avoir la possibilité de créer et de modifier un workflow afin de faciliter le scale-out et l’automatisation de diverses tâches au sein de la plateforme. |
Intégration | D’autres technologies tierces telles que la création de tickets ou l’orchestration doivent être en mesure de s’intégrer à la plateforme via un script ou des API REST. |
Identifier les scénarios clés
Les services de gouvernance Microsoft Purview peuvent être utilisés pour gérer de manière centralisée la gouvernance des données dans le patrimoine de données d’une organization couvrant les environnements cloud et locaux. Pour réussir l’implémentation, vous devez identifier les scénarios clés qui sont critiques pour l’entreprise. Ces scénarios peuvent franchir les limites de l’unité commerciale ou affecter plusieurs personnages utilisateur amont ou en aval.
Ces scénarios peuvent être écrits de différentes façons, mais vous devez inclure au moins ces cinq dimensions :
- Persona : qui sont les utilisateurs ?
- Système source : quelles sont les sources de données telles que Azure Data Lake Storage Gen2 ou Azure SQL Database ?
- Zone d’impact : quelle est la catégorie de ce scénario ?
- Scénarios détaillés : comment les utilisateurs utilisent Microsoft Purview pour résoudre les problèmes ?
- Résultat attendu : quels sont les critères de réussite ?
Les scénarios doivent être spécifiques, actionnables et exécutables avec des résultats mesurables. Voici quelques exemples de scénarios que vous pouvez utiliser :
Scénario | Détails | Persona |
---|---|---|
Cataloguer les ressources critiques pour l’entreprise | J’ai besoin d’informations sur chaque jeu de données pour avoir une bonne compréhension de ce qu’il s’agit. Ce scénario inclut des données de métadonnées métier et techniques sur le jeu de données dans le catalogue. Les sources de données incluent Azure Data Lake Storage Gen2, Azure Synapse DW et/ou Power BI. Ce scénario inclut également des ressources locales telles que SQL Server. | Analyste d’entreprise, Scientifique des données, Ingénieurs Données |
Découvrir les ressources critiques pour l’entreprise | J’ai besoin d’un moteur de recherche capable de rechercher dans toutes les métadonnées du catalogue. Je devrais pouvoir effectuer une recherche à l’aide d’un terme technique, d’un terme commercial avec une recherche simple ou complexe à l’aide de caractères génériques. | Analyste d’entreprise, Scientifique des données, Ingénieurs Données, Administration données |
Suivre les données pour comprendre leur origine et résoudre les problèmes de données | Je dois disposer d’une traçabilité des données pour effectuer le suivi des données dans les rapports, les prédictions ou les modèles jusqu’à leur source d’origine. J’ai également besoin de comprendre les modifications apportées aux données et où les données se sont stockées tout au long du cycle de vie des données. Ce scénario doit prendre en charge les pipelines de données hiérarchisés Azure Data Factory et Databricks. | Ingénieurs Données, Scientifique des données |
Enrichir des métadonnées sur des ressources de données critiques | Je dois enrichir le jeu de données dans le catalogue avec des métadonnées techniques générées automatiquement. La classification et l’étiquetage en sont quelques exemples. | Ingénieurs Données, propriétaire du domaine/de l’entreprise |
Gouverner les ressources de données avec une expérience utilisateur conviviale | J’ai besoin d’un glossaire métier pour les métadonnées spécifiques à l’entreprise. Les utilisateurs professionnels peuvent utiliser Microsoft Purview pour les scénarios en libre-service afin d’annoter leurs données et de permettre aux données d’être facilement découvertes via la recherche. | Propriétaire de domaine/entreprise, analyste d’entreprise, Scientifique des données, Ingénieurs Données |
Points d’intégration à Microsoft Purview
Il est probable qu’un organization mature dispose déjà d’un catalogue de données. La question clé est de savoir s’il faut continuer à utiliser la technologie existante et à se synchroniser avec le Mappage de données Microsoft Purview et Data Catalog ou non. Pour gérer la synchronisation avec des produits existants dans un organization, Microsoft Purview fournit des API REST Atlas. Les API Atlas fournissent un mécanisme puissant et flexible qui gère à la fois les scénarios d’envoi (push) et d’extraction (pull). Les informations peuvent être publiées sur Microsoft Purview à l’aide des API Atlas pour le démarrage ou pour envoyer (push) les dernières mises à jour d’un autre système dans Microsoft Purview. Les informations disponibles dans Microsoft Purview peuvent également être lues à l’aide des API Atlas, puis synchronisées avec les produits existants.
Pour d’autres scénarios d’intégration tels que la création de tickets, l’interface utilisateur personnalisée et l’orchestration, vous pouvez utiliser des API Atlas et des points de terminaison Kafka. En général, il existe quatre points d’intégration avec Microsoft Purview :
-
Ressource de données : Cela permet à Microsoft Purview d’analyser les ressources d’un magasin afin d’énumérer ces ressources et de collecter toutes les métadonnées disponibles les concernant. Par conséquent, pour SQL, il peut s’agir d’une liste de bases de données, de tables, de procédures stockées, de vues et de données de configuration les concernant conservées dans des emplacements tels que
sys.tables
. Pour quelque chose comme Azure Data Factory (ADF), il peut s’agir d’énumérer tous les pipelines et d’obtenir des données sur le moment où ils ont été créés, la dernière exécution, l’état actuel. - Traçabilité : cela permet à Microsoft Purview de collecter des informations à partir d’un système d’analyse/mutation de données sur la façon dont les données se déplacent. Pour quelque chose comme Spark, il peut s’agir de collecter des informations à partir de l’exécution d’un notebook pour voir quelles données le notebook a ingérées, comment il l’a transformé et où il les a générées. Pour quelque chose comme SQL, il peut s’agir d’analyser les journaux des requêtes pour rétroconcevoir les opérations de mutation exécutées et ce qu’elles ont fait. Nous prenons en charge la traçabilité basée sur l’envoi et l’extraction en fonction des besoins.
- Classification : Cela permet à Microsoft Purview de prendre des échantillons physiques à partir de sources de données et de les exécuter via notre système de classification. Le système de classification détermine la sémantique d’un élément de données. Par exemple, nous savons peut-être qu’un fichier est un fichier Parquet et comporte trois colonnes et que la troisième est une chaîne. Mais les classifieurs que nous exécutons sur les exemples nous indiquent que la chaîne est un nom, une adresse ou un numéro de téléphone. L’activation de ce point d’intégration signifie que nous avons défini comment Microsoft Purview peut ouvrir des objets tels que des notebooks, des pipelines, des fichiers Parquet, des tables et des conteneurs.
- Expérience incorporée : les produits qui ont une expérience de type « studio » (par exemple, ADF, Synapse, SQL Studio, PBI et Dynamics) veulent généralement permettre aux utilisateurs de découvrir les données avec lesquelles ils souhaitent interagir et de trouver des emplacements pour générer des données. Le catalogue de Microsoft Purview peut vous aider à accélérer ces expériences en fournissant une expérience d’incorporation. Cette expérience peut se produire au niveau de l’API ou de l’expérience utilisateur au choix du partenaire. En incorporant un appel à Microsoft Purview, le organization peut tirer parti de la carte du patrimoine de données de Microsoft Purview pour rechercher des ressources de données, consulter la traçabilité, case activée schémas, examiner les évaluations, les contacts, etc.
Collecte de questions
Une fois que votre organization est d’accord sur les objectifs et les objectifs de haut niveau, il y aura de nombreuses questions de plusieurs groupes. Il est essentiel de rassembler ces questions afin d’élaborer un plan pour répondre à toutes les préoccupations. Veillez à inclure des groupes pertinents au fur et à mesure que vous rassemblez ces questions. Vous pouvez utiliser notre documentation pour commencer à y répondre.
Voici quelques exemples de questions que vous pouvez rencontrer pendant la phase initiale :
- Quels sont les main sources de données et systèmes de données dans notre organization ?
- Quelles sources de données sont prises en charge ?
- Pour les sources de données qui ne sont pas encore prises en charge par Microsoft Purview, quelles sont mes options ?
- Comment devons-nous budgétifier Microsoft Purview ?
- Qui utilisera Microsoft Purview et quels rôles auront-ils ?
- Qui peut analyser les nouvelles sources de données ?
- Qui peut modifier le contenu à l’intérieur de Microsoft Purview ?
- Quels processus puis-je utiliser pour améliorer la qualité des données dans Microsoft Purview ?
- Comment démarrer la plateforme avec des ressources critiques, des termes de glossaire et des contacts existants ?
- Comment sécuriser Microsoft Purview ?
- Comment pouvons-nous recueillir des commentaires et construire un processus durable ?
- Que pouvons-nous faire en cas de catastrophe ?
- Nous utilisons déjà Azure Data Catalog, pouvons-nous migrer vers Microsoft Purview ?
Même si vous n’avez peut-être pas la réponse immédiate à la plupart de ces questions, la collecte de questions peut aider votre organization à structurer ce projet et à vous assurer que toutes les exigences « obligatoires » peuvent être satisfaites.
Inclure les bonnes parties prenantes
Pour garantir la réussite de l’implémentation de Microsoft Purview pour l’ensemble de votre organization, il est important d’impliquer les bonnes parties prenantes. Seules quelques personnes sont impliquées dans la phase initiale. Toutefois, à mesure que l’étendue s’étend, vous aurez besoin d’un plus grand nombre de personnes pour contribuer au projet et fournir des commentaires.
Voici quelques parties prenantes clés que vous souhaiterez peut-être inclure :
Persona | Rôles |
---|---|
Responsable des données | Le CDO supervise une gamme de fonctions qui peuvent inclure la gestion des données, la qualité des données, la master la gestion des données, la science des données, l’aide à la décision et la création d’une stratégie de données. Ils peuvent être le sponsor du projet d’implémentation Microsoft Purview. |
Propriétaire du domaine/de l’entreprise | Un homme d’affaires qui influence l’utilisation des outils et a un contrôle budgétaire |
Analyste de données | Capable d’encadrer un problème métier et d’analyser les données pour aider les dirigeants à prendre des décisions commerciales |
Architecte de données | Concevoir des bases de données pour des applications métier stratégiques, ainsi que concevoir et implémenter la sécurité des données |
Ingénieurs Données | Exploiter et gérer la pile de données, extraire des données de différentes sources, intégrer et préparer des données, configurer des pipelines de données |
Scientifique des données | Créer des modèles analytiques et configurer des produits de données accessibles par les API |
Administration de base de données | Posséder, suivre et résoudre les incidents et demandes liés à la base de données dans le cadre de contrats de niveau de service (SLA) ; Peut configurer des pipelines de données |
DevOps | Développement et implémentation d’applications métier ; peut inclure l’écriture de scripts et des fonctionnalités d’orchestration |
Spécialiste de la sécurité des données | Évaluer la sécurité globale du réseau et des données, qui implique des données entrantes et sortantes de Microsoft Purview |
Créer un processus pour passer en production
Ci-dessous, nous avons fourni un plan de déploiement potentiel en quatre phases qui inclut des tâches, des liens utiles et des critères d’acceptation pour chaque phase :
Phase 1 : Pilote
Dans cette phase, Microsoft Purview doit être créé et configuré pour un petit ensemble d’utilisateurs. En règle générale, il s’agit simplement d’un groupe de 2 à 3 personnes travaillant ensemble pour exécuter des scénarios de bout en bout. Ils sont considérés comme les défenseurs de Microsoft Purview dans leur organization. L’objectif main de cette phase est de s’assurer que les fonctionnalités clés peuvent être satisfaites et que les parties prenantes appropriées sont au courant du projet.
Tâches à effectuer
Tâche | Détails | Durée |
---|---|---|
Rassembler & s’entendre sur les exigences | Discutez avec toutes les parties prenantes pour rassembler un ensemble complet d’exigences. Différents personnages doivent participer pour s’entendre sur un sous-ensemble d’exigences à remplir pour chaque phase du projet. | Une semaine |
Navigation dans le portail de gouvernance Microsoft Purview | Découvrez comment utiliser Microsoft Purview à partir de la page d’accueil. | Un jour |
Configurer ADF pour la traçabilité | Identifiez les pipelines clés et les ressources de données. Rassemblez toutes les informations requises pour vous connecter à un compte ADF interne. | Un jour |
Analysez une source de données telle qu’Azure Data Lake Storage Gen2 ou un serveur SQL. | Ajoutez la source de données et configurez une analyse. Vérifiez que l’analyse détecte correctement toutes les ressources. | Deux jours |
Rechercher et parcourir | Autoriser les utilisateurs finaux à accéder à Microsoft Purview et à effectuer des scénarios de recherche et de navigation de bout en bout. | Un jour |
Autres liens utiles
- Créer un compte Microsoft Purview
- Créer un regroupement
- Concept : Autorisations et accès
- Glossaire du produit Microsoft Purview
Critères d’acceptation
- Le compte Microsoft Purview est créé correctement dans organization abonnement sous le locataire organization.
- Un petit groupe d’utilisateurs avec plusieurs rôles peut accéder à Microsoft Purview.
- Microsoft Purview est configuré pour analyser au moins une source de données.
- Les utilisateurs doivent être en mesure d’extraire les valeurs clés de Microsoft Purview, telles que :
- Rechercher et parcourir
- Traçabilité
- Les utilisateurs doivent être en mesure d’attribuer la propriété de la ressource dans la page des ressources.
- Présentation et démonstration pour sensibiliser les principales parties prenantes.
- Adhésion de la direction pour approuver davantage de ressources pour la phase MVP.
Phase 2 : Produit minimum viable
Une fois que vous avez les exigences convenues et que vous avez participé aux unités commerciales pour intégrer Microsoft Purview, l’étape suivante consiste à travailler sur une version de produit minimum viable (MVP). Dans cette phase, vous allez étendre l’utilisation de Microsoft Purview à un plus grand nombre d’utilisateurs qui auront plus de besoins horizontalement et verticalement. Il existe des scénarios clés qui doivent être respectés horizontalement pour tous les utilisateurs, tels que les termes du glossaire, la recherche et la navigation. Il y aura également des exigences détaillées verticalement pour chaque division ou groupe afin de couvrir des scénarios spécifiques de bout en bout, tels que la traçabilité de Azure Data Lake Storage à Azure Synapse DW à Power BI.
Tâches à effectuer
Tâche | Détails | Durée |
---|---|---|
Analyser Azure Synapse Analytics | Commencer à intégrer vos sources de base de données et les analyser pour remplir les ressources clés | Deux jours |
Créer des classifications et des règles personnalisées | Une fois vos ressources analysées, vos utilisateurs peuvent se rendre compte qu’il existe d’autres cas d’usage pour une classification supplémentaire en plus des classifications par défaut de Microsoft Purview. | 2-4 semaines |
Analyser Power BI | Si votre organization utilise Power BI, vous pouvez analyser Power BI afin de collecter toutes les ressources de données utilisées par les scientifiques des données ou les analystes de données qui ont des exigences pour inclure la traçabilité de la couche de stockage. | 1-2 semaines |
Importer les termes du glossaire | Dans la plupart des cas, votre organization peut déjà développer une collection de termes de glossaire et d’affectation de termes à des ressources. Cela nécessite un processus d’importation dans Microsoft Purview via .csv fichier. | Une semaine |
Ajouter des contacts à des ressources | Pour les principales ressources, vous pouvez établir un processus pour autoriser d’autres personnages à attribuer des contacts ou à les importer via des API REST. | Une semaine |
Ajouter des étiquettes sensibles et analyser | Cela peut être facultatif pour certaines organisations, en fonction de l’utilisation de l’étiquetage à partir de Microsoft 365. | 1-2 semaines |
Obtenir des informations sensibles et de classification | Pour les rapports et les insights dans Microsoft Purview, vous pouvez accéder à cette fonctionnalité pour obtenir différents rapports et fournir une présentation à la direction. | Un jour |
Intégrer davantage d’utilisateurs à l’aide d’utilisateurs gérés par Microsoft Purview | Cette étape nécessite que le Administration Microsoft Purview travaille avec le Microsoft Entra Administration pour établir de nouvelles Groupes de sécurité pour accorder l’accès à Microsoft Purview. | Une semaine |
Autres liens utiles
- Meilleures pratiques en matière d'architecture des collections
- Meilleures pratiques de classification
- Meilleures pratiques en matière d'étiquetage
Critères d’acceptation
- Intégration réussie d’un plus grand groupe d’utilisateurs à Microsoft Purview (50+)
- Analyser les sources de données critiques pour l’entreprise
- Importer et affecter tous les termes critiques du glossaire
- Test réussi de l’étiquetage important sur les ressources clés
- Scénarios minimaux réussis pour les utilisateurs des unités commerciales ayant participé
Phase 3 : Préproduction
Une fois la phase MVP passée, il est temps de planifier le jalon de préproduction. Vous pouvez inclure l’analyse sur des sources de données locales telles que SQL Server. S’il existe une lacune dans les sources de données non prises en charge par Microsoft Purview, il est temps d’explorer l’API Atlas pour comprendre d’autres options.
Tâches à effectuer
Tâche | Détails | Durée |
---|---|---|
Affiner votre analyse à l’aide de l’ensemble de règles d’analyse | Votre organization aura de nombreuses sources de données pour la préproduction. Il est important de définir au préalable des critères clés pour l’analyse afin que les classifications et l’extension de fichier puissent être appliquées de manière cohérente dans l’ensemble du tableau. | 1-2 jours |
Évaluer la disponibilité des régions pour l’analyse de chacune de vos sources en vérifiant les pages sources | En fonction de la région des sources de données et des exigences organisationnelles en matière de conformité et de sécurité, vous pouvez envisager les régions qui doivent être disponibles pour l’analyse. | Un jour |
Comprendre le concept de pare-feu lors de l’analyse | Cette étape nécessite une exploration de la façon dont le organization configure son pare-feu et comment Microsoft Purview peut s’authentifier pour accéder aux sources de données à des fins d’analyse. | Un jour |
Comprendre Private Link concept lors de l’analyse | Si votre organization utilise Private Link, vous devez jeter les bases de la sécurité réseau pour inclure Private Link dans les exigences. | Un jour |
Analyser les SQL Server locales | Cette option est facultative si vous avez des SQL Server locales. L’analyse nécessite la configuration d’un Integration Runtime auto-hébergé et l’ajout de SQL Server en tant que source de données. | 1-2 semaines |
Utiliser l’API REST Microsoft Purview pour les scénarios d’intégration | Si vous avez besoin d’intégrer Microsoft Purview à d’autres technologies tierces telles que l’orchestration ou le système de tickets, vous pouvez explorer la zone API REST. | 1-4 semaines |
Comprendre la tarification de Microsoft Purview | Cette étape fournit les organization informations financières importantes pour prendre une décision. | 1-5 jours |
Autres liens utiles
- Meilleures pratiques en matière d'étiquetage
- Meilleures pratiques en matière d'architecture de réseau
Critères d’acceptation
- Intégration réussie d’au moins une unité commerciale avec tous les utilisateurs
- Analyser une source de données locale telle que SQL Server
- Preuve de concept au moins un scénario d’intégration à l’aide de l’API REST
- Terminer un plan pour passer en production, qui doit inclure des domaines clés sur l’infrastructure et la sécurité
Phase 4 : Production
Les phases ci-dessus doivent être suivies pour créer une gestion efficace du cycle de vie des données, qui constitue la base d’une meilleure gouvernance des programmes. La gouvernance des données aidera vos organization à se préparer aux tendances croissantes telles que l’IA, Hadoop, l’IoT et la blockchain. Ce n’est que le début pour de nombreux aspects des données et de l’analytique, et il y en a beaucoup d’autres qui peuvent être discutés. Le résultat de cette solution offrirait les avantages suivants :
- Axée sur l’entreprise : solution alignée sur les besoins et les scénarios de l’entreprise par rapport aux exigences techniques.
- Future Ready : une solution optimise les fonctionnalités par défaut de la plateforme et utilise les pratiques standardisées du secteur pour les activités de configuration ou de script afin de prendre en charge les progrès/l’évolution de la plateforme.
Tâches à effectuer
Tâche | Détails | Durée |
---|---|---|
Analyser les sources de données de production avec le pare-feu activé | Si cela est facultatif lorsque le pare-feu est en place, mais qu’il est important d’explorer les options permettant de renforcer votre infrastructure. | 1-5 jours |
Activer Private Link | Si cette option est facultative lorsque Private Link est utilisé. Sinon, vous pouvez ignorer ce paramètre, car il s’agit d’un critère obligatoire lorsque Private est activé. | 1-5 jours |
Créer un workflow automatisé | Le flux de travail est important pour automatiser les processus tels que l’approbation, l’escalade, la révision et la gestion des problèmes. | 2-3 semaines |
Créer une documentation sur l’opération | La gouvernance des données n’est pas un projet unique. Il s’agit d’un programme continu visant à alimenter la prise de décision pilotée par les données et à créer des opportunités pour l’entreprise. Il est essentiel de documenter les procédures clés et les normes métier. | Une semaine |
Autres liens utiles
- Gérer les exécutions de flux de travail
- Demandes et approbations de flux de travail
- Gérer les durées d'exécution de l'intégration
- Demander l’accès à une ressource de données
Critères d’acceptation
- Intégration réussie de toutes les unités commerciales et de leurs utilisateurs
- Répondre aux exigences d’infrastructure et de sécurité pour la production
- Répondre à tous les cas d’usage requis par les utilisateurs
Renforcement de la plateforme
D’autres étapes de renforcement peuvent être effectuées :
- Augmentez la posture de sécurité en activant l’analyse sur les ressources de pare-feu ou en utilisant Private Link
- Affiner l’analyse d’étendue pour améliorer les performances de l’analyse
- Utiliser des API REST pour exporter des métadonnées et des propriétés critiques pour la sauvegarde et la récupération
- Utiliser le workflow pour automatiser la création de tickets et les événements afin d’éviter les erreurs humaines
- Utilisez des stratégies pour gérer l’accès aux ressources de données via le portail de gouvernance Microsoft Purview.
Considérations relatives au cycle de vie
Un autre aspect important à inclure dans votre processus de production est la façon dont les classifications et les étiquettes peuvent être migrées. Microsoft Purview a plus de 90 classifieurs système. Vous pouvez appliquer des classifications système ou personnalisées sur des ressources de fichier, de table ou de colonne. Les classifications sont comme des balises d’objet et sont utilisées pour marquer et identifier le contenu d’un type spécifique trouvé dans votre patrimoine de données pendant l’analyse. Les étiquettes de confidentialité sont utilisées pour identifier les catégories de types de classification dans les données de votre organisation, puis regrouper les stratégies que vous souhaitez appliquer à chaque catégorie. Il utilise les mêmes types d’informations sensibles que Microsoft 365, ce qui vous permet d’étendre vos stratégies de sécurité et votre protection existantes à l’ensemble de votre contenu et de votre patrimoine de données. Il peut analyser et classer automatiquement des documents. Par exemple, si vous avez un fichier nommé multiple.docx et qu’il contient un numéro d’identification national dans son contenu, Microsoft Purview ajoute une classification telle que numéro d’identification national de l’UE dans la page Détails de la ressource.
Dans le Mappage de données Microsoft Purview, il existe plusieurs domaines dans lesquels les administrateurs de catalogue doivent garantir la cohérence et les bonnes pratiques de maintenance tout au long de leur cycle de vie :
- Ressources de données : les sources de données doivent être réanalysées dans les environnements. Il n’est pas recommandé d’analyser uniquement en développement, puis de les régénérer à l’aide d’API en production. La main raison est que les scanneurs Microsoft Purview effectuent beaucoup plus de « câblage » en arrière-plan sur les ressources de données, ce qui peut être complexe pour les déplacer vers un autre instance Microsoft Purview. Il est beaucoup plus facile d’ajouter simplement la même source de données en production et d’analyser à nouveau les sources. La meilleure pratique générale consiste à disposer d’une documentation sur toutes les analyses, connexions et mécanismes d’authentification utilisés.
- Ensembles de règles d’analyse : il s’agit de votre collection de règles affectées à une analyse spécifique, comme le type de fichier et les classifications à détecter. Si vous n’avez pas autant d’ensembles de règles d’analyse, il est possible de les recréer manuellement via production. Cela nécessite un processus interne et une bonne documentation. Toutefois, si vos ensembles de règles changent sur une base quotidienne ou hebdomadaire, cela peut être résolu en explorant l’itinéraire de l’API REST.
- Classifications personnalisées : vos classifications peuvent également ne pas changer régulièrement. Au cours de la phase initiale du déploiement, la compréhension des différentes exigences pour créer des classifications personnalisées peut prendre un certain temps. Toutefois, une fois réglé, cela nécessitera peu de changements. Il est donc recommandé ici de migrer manuellement toutes les classifications personnalisées sur ou d’utiliser l’API REST.
- Glossaire : il est possible d’exporter et d’importer des termes de glossaire via l’expérience utilisateur. Pour les scénarios d’automatisation, vous pouvez également utiliser l’API REST.
- Stratégies de modèle d’ensemble de ressources : cette fonctionnalité est avancée pour toutes les organisations classiques à appliquer. Dans certains cas, votre Azure Data Lake Storage a des conventions d’affectation de noms de dossiers et une structure spécifique qui peuvent entraîner des problèmes pour que Microsoft Purview génère le jeu de ressources. Votre unité commerciale peut également vouloir modifier la construction de l’ensemble de ressources avec davantage de personnalisations pour répondre aux besoins de l’entreprise. Pour ce scénario, il est préférable de suivre toutes les modifications via l’API REST et de documenter les modifications via une plateforme de gestion de version externe.
- Attribution de rôle : c’est là que vous contrôlez qui a accès à Microsoft Purview et les autorisations dont il dispose. Microsoft Purview dispose également de l’API REST pour prendre en charge l’exportation et l’importation d’utilisateurs et de rôles, mais ce n’est pas compatible avec l’API Atlas. Il est recommandé d’attribuer un groupe de sécurité Azure et de gérer l’appartenance au groupe à la place.
Déplacement de locataires
Le déplacement de locataires n’est actuellement pas pris en charge pour Microsoft Purview.
Déplacement d’abonnements
Il est possible de déplacer votre compte Microsoft Purview entre les abonnements. Toutefois, si votre compte a été créé avant le 15 décembre 2023 (ou déployé à l’aide d’une version d’API antérieure à la version 2023-05-01-preview) ou s’il utilise un Event Hubs managé, le compte de stockage managé et les Event Hubs managés associés à votre compte Microsoft Purview ne migreront pas avec votre instance. Votre compte Microsoft Purview pourra toujours fonctionner, mais vous ne devez pas supprimer ces ressources.
Si vous devez supprimer les ressources managées de l’autre abonnement, vous devez créer un compte Microsoft Purview et migrer vos informations vers ce nouveau compte, avant de supprimer l’original et ses ressources managées.