Ajout de connaissances à une base de connaissances
S'applique à : SQL Server
Cette rubrique décrit les différentes façons d'ajouter des connaissances à une base de connaissances dans Data Quality Services (DQS). Avant de pouvoir effectuer des opérations de qualité des données, vous devez disposer de connaissances sur les données. Pour acquérir ces connaissances, vous devez créer et maintenir une base de connaissances de qualité des données, et y ajouter des connaissances liées à un type spécifique de source de données. La base de connaissances est un référentiel de connaissances sur vos données qui vous permet de comprendre vos données et de préserver leur intégrité.
La base de connaissances contient des domaines de données en rapport avec la source de données. Pour chaque domaine de données, la base de données DQKB stocke l'ensemble des termes, fautes d'orthographe, règles de validation et d'entreprise, et données de référence identifiés qui peuvent être utilisés pour effectuer des actions de qualité des données sur la source de données. DQS utilise ces connaissances pour identifier les données incorrectes ou non valides, ou pour effectuer des mises en correspondance.
Vous pouvez ajouter des connaissances à une base de connaissances via les méthodes assistées par ordinateur ou interactives suivantes.
Effectuer une découverte des connaissances
La découverte des connaissances analyse un exemple des données en fonction de critères de qualité des données, puis ajoute les connaissances qu'il a acquises à la base de connaissances. Il s'agit d'un processus assisté par ordinateur qui identifie les incohérences et les erreurs de syntaxe dans les données, et qui suggère des modifications à apporter aux données. L'activité de découverte des connaissances est un Assistant qui comprend une page vous permettant de gérer de façon interactive les valeurs de domaine.
Pour plus d'informations dans la documentation, consultez Perform Knowledge Discovery.
Pour obtenir une vidéo qui montre comment effectuer une découverte des connaissances, cliquez ici.
Gérer des valeurs de données dans un domaine
DQS vous permet de modifier et d'augmenter de façon interactive les métadonnées qui sont générées par l'activité de découverte des connaissances assistée par ordinateur. Vous effectuez ces opérations dans l'activité Gestion de l'arborescence du domaine, où vous pouvez appliquer une modification à une valeur de données spécifique.
Pour plus d'informations dans la documentation, consultez Change Domain Values.
Pour obtenir une vidéo qui montre comment effectuer la gestion de l'arborescence du domaine, cliquez ici. Notez que dans cette vidéo, vous modifiez des valeurs de domaine dans la page Gestion de l'arborescence du domaine de l'Assistant de découverte des connaissances. Vous pouvez également effectuer ces étapes dans la page Valeurs du domaine de l'activité Gestion de l'arborescence du domaine.
Importer des connaissances à partir d'un fichier .dqs
Vous pouvez importer un domaine à partir d'un fichier de données .dqs vers une base de connaissances existante, ou importer la totalité d'une base de connaissances d'un fichier .dqs vers une nouvelle base de connaissances. Pour ce faire, vous devez d'abord exporter un domaine ou une base de connaissances existant vers un fichier .dqs. Un fichier .dqs contenant un domaine inclut toutes les données du domaine ; un fichier .dqs contenant une base de connaissances contient toutes les informations de la base de connaissances, y compris les domaines et la stratégie de correspondance.
- Pour plus d’informations dans la documentation, consultez Importer un domaine à partir d’un fichier .dqs ou Importer une base de connaissances à partir d’un fichier .dqs.
Importer des connaissances à partir d'un fichier Excel
Vous pouvez importer des valeurs de domaine à partir d'un fichier de feuille de calcul Excel vers un domaine ou une base de connaissances existant. Pour ce faire, vous devez d'abord créer une feuille de calcul Excel avec les valeurs du domaine que vous voulez importer, puis vérifier qu'Excel est installé sur l'ordinateur Data Quality Client afin de pouvoir importer les valeurs à l'aide de Data Quality Client. Vous ne pouvez pas exporter des valeurs de domaine d'un domaine ou d'une base de connaissances vers un fichier Excel.
- Pour plus d’informations dans la documentation, consultez Importer les valeurs d’un fichier Excel dans un domaine ou Importer les domaines d’un fichier Excel dans la découverte des connaissances.
Réimporter des connaissances d'un projet dans la base de connaissances
Après avoir exécuté un projet de nettoyage ou de qualité des données de correspondance à l'aide d'une base de connaissances, vous pouvez réimporter les connaissances créées pendant le nettoyage ou la correspondance dans cette base de connaissances. Cela vous permet de conserver les connaissances générées pendant le projet, et de générer en permanence les connaissances dans la base de connaissances.
- Pour plus d’informations dans la documentation, consultez Importer des valeurs de projet de nettoyage dans un domaine.
Utiliser la base de connaissances DQS par défaut
DQS est fourni avec une base de connaissances prégénérée appelée Données DQS, qui contient des domaines pour des données relatives à des sociétés et adresses des États-Unis. Cette base de connaissances peut être utilisée pour démarrer rapidement un projet sans créer une nouvelle base de connaissances. La base de connaissances Données DQS est en lecture seule, mais le gestionnaire de données peut créer une base de connaissances à partir de celle-ci.
- Pour plus d'informations dans la documentation, consultez Using the DQS Default Knowledge Base.