Qualité des données pour les bases de données mises en miroir Microsoft Fabric
En tant que solution de réplication de données, la mise en miroir dans Fabric est une solution à faible coût et à faible latence pour regrouper les données de différents systèmes dans une seule plateforme d’analytique. Vous pouvez répliquer en continu votre patrimoine de données existant directement dans OneLake de Fabric, y compris les données de Azure SQL Database, Azure Cosmos DB et Snowflake.
La mise en miroir dans Fabric permet aux utilisateurs de profiter d’un produit de bout en bout conçu pour simplifier vos besoins d’analyse. Conçue pour l’ouverture et la collaboration entre Microsoft et les solutions technologiques capables de lire le format de table delta lake open source, la mise en miroir est une solution à faible coût et à faible latence qui vous permet de créer une réplica de vos données dans OneLake, qui peut être utilisée pour tous vos besoins analytiques. Pour plus d’informations sur la mise en miroir d’infrastructure , consultez la documentation fabric.
Configurer la qualité des données pour une base de données mise en miroir Fabric
Activez la mise en miroir dans votre locataire Fabric. Les administrateurs Power BI peuvent activer ou désactiver la mise en miroir pour l’ensemble du organization ou pour des groupes de sécurité spécifiques, à l’aide du paramètre disponible dans le portail d’administration Power BI. La mise en miroir est activée en créant une connexion sécurisée à votre source de données opérationnelle. Vous choisissez de répliquer une base de données entière ou des tables individuelles, et la mise en miroir maintient automatiquement vos données synchronisées. Une fois configurées, les données sont répliquées en continu dans OneLake pour une consommation analytique.
Une fois la mise en miroir activée et la réplication lancée, vérifiez que la réplication de la mise en miroir se termine correctement.
Sous l’onglet Création de rapports , sélectionnez Mettre à jour automatiquement le modèle sémantique.
Accédez à Mappage de données Microsoft Purview et analysez la source de données. Utilisez l’authentification du principal de service.
Une fois l’analyse terminée, associez les nouvelles ressources de données à un produit de données dans Catalogue unifié Microsoft Purview pour la curation et l’évaluation de la qualité des données.
Dans votre produit de données, sélectionnez la base de données mise en miroir (et non les tables individuelles) dans le catalogue. Il doit être disponible en tant que jeu de données Power BI.
Toutes les tables à l’intérieur de votre base de données mise en miroir doivent être ajoutées automatiquement au produit de données en tant que tables Delta OneLake.
Dans la zone Qualité des données de la gestion heath dans Catalogue unifié, exécutez une analyse de la qualité des données ou profilez vos données comme d’habitude.
Importante
- Utilisez des principaux de service pour les analyses de mappage de données et une identité managée pour les analyses de qualité des données.
- Sélectionnez la base de données mise en miroir au lieu de tables individuelles.
- Mettre à jour le modèle sémantique à chaque fois.
- Si vos tables de base de données mises en miroir ne sont pas disponibles dans Fabric Lakehouse, contactez le support Fabric.
- L’analyse de la qualité des données est prise en charge uniquement pour les formats de fichiers Delta, Iceberg et Parquet Lakehouse.
- Il existe une dépendance vis-à-vis de l’équipe Fabric pour différencier les éléments de raccourci des éléments natifs dans les sous-articles du Kit de développement logiciel (SDK) OneLake pour Lakehouse. Pour l’instant, tous les éléments de raccourci (tables et fichiers) sont considérés comme des éléments natifs dans l’analyse.