Сопоставление качества данных в надстройке MDS для Excel
Со временем в репозиторий MDS потребуется добавить дополнительные данные. Перед добавлением может быть полезно сравнить новые данные с данными, которые уже управляются в MDS, чтобы избежать дублирования или добавления неточных данных.
Надстройка MDS для Excel использует функцию data Quality Services (DQS) SQL Server для сопоставления данных, которые похожи. При использовании функции сопоставления в надстройке одинаковые записи группируются вместе и выводится показатель, отражающий точность результата. Дополнительные сведения о возможностях сопоставления в службах DQS см. в разделе Data Matching.
Рабочий процесс для сопоставления качества данных
При использовании DQS с надстройкой MDS для Excel используйте следующий рабочий процесс:
Получите список данных, управляемых MDS, и объедините его со списком данных, которые не управляются в MDS. Дополнительные сведения см. в статье Объединение данных (надстройка MDS для Excel).
Используйте базу набора знаний служб DQS для сравнения данных в объединенном списке. Дополнительные сведения см. в статье Сопоставление похожих данных (надстройка MDS для Excel).
Чтобы просмотреть дополнительные сведения о схожести, обнаруженной службами DQS, отобразите столбцы со сведениями.
Просмотрите результаты и определите, какие данные следует добавить в репозиторий MDS и какие данные дублируются.
Опубликуйте новые и/или обновленные данных в репозитории MDS.
Базы знаний
Результаты сопоставления, предлагаемые в надстройке, основаны на базе знаний служб DQS.
База знаний по умолчанию (DQS Data) создается при установке служб DQS. Если выбрать для использования базу знаний по умолчанию (без добавления политики сопоставления по умолчанию в базу знаний клиента DQS Data Quality), необходимо сопоставить столбцы в листе с доменами в базе знаний, затем присвоить значение веса с выбранными доменами.
Для создания новой базы знаний с политикой маршрутов можно использовать клиент DQS, а можно добавить политику сопоставления в базе знаний по умолчанию. В этом случае значения веса определяются уже созданной политикой сопоставления и потребуется только сопоставить столбцы и домены. Дополнительные сведения см. в статье Create a Matching Policy.
Дополнительные сведения о базах знаний см. в разделе DQS Knowledge Bases and Domains.
Связанные задачи
Описание задачи | Раздел |
---|---|
Объедините внешние данные с данными, управляемыми MDS, и подготовьтесь к их сравнению. | Объединение данных (надстройка MDS для Excel) |
Воспользуйтесь базой набора знаний служб DQS для определения схожести данных. | Сопоставление схожих данных (надстройка MDS для Excel) |