Поделиться через


Сопоставление качества данных в надстройке MDS для Excel

Со временем в репозиторий MDS потребуется добавить дополнительные данные. Перед добавлением может быть полезно сравнить новые данные с данными, которые уже управляются в MDS, чтобы избежать дублирования или добавления неточных данных.

Надстройка MDS для Excel использует функцию data Quality Services (DQS) SQL Server для сопоставления данных, которые похожи. При использовании функции сопоставления в надстройке одинаковые записи группируются вместе и выводится показатель, отражающий точность результата. Дополнительные сведения о возможностях сопоставления в службах DQS см. в разделе Data Matching.

Рабочий процесс для сопоставления качества данных

При использовании DQS с надстройкой MDS для Excel используйте следующий рабочий процесс:

  1. Получите список данных, управляемых MDS, и объедините его со списком данных, которые не управляются в MDS. Дополнительные сведения см. в статье Объединение данных (надстройка MDS для Excel).

  2. Используйте базу набора знаний служб DQS для сравнения данных в объединенном списке. Дополнительные сведения см. в статье Сопоставление похожих данных (надстройка MDS для Excel).

  3. Чтобы просмотреть дополнительные сведения о схожести, обнаруженной службами DQS, отобразите столбцы со сведениями.

  4. Просмотрите результаты и определите, какие данные следует добавить в репозиторий MDS и какие данные дублируются.

  5. Опубликуйте новые и/или обновленные данных в репозитории MDS.

Базы знаний

Результаты сопоставления, предлагаемые в надстройке, основаны на базе знаний служб DQS.

  • База знаний по умолчанию (DQS Data) создается при установке служб DQS. Если выбрать для использования базу знаний по умолчанию (без добавления политики сопоставления по умолчанию в базу знаний клиента DQS Data Quality), необходимо сопоставить столбцы в листе с доменами в базе знаний, затем присвоить значение веса с выбранными доменами.

  • Для создания новой базы знаний с политикой маршрутов можно использовать клиент DQS, а можно добавить политику сопоставления в базе знаний по умолчанию. В этом случае значения веса определяются уже созданной политикой сопоставления и потребуется только сопоставить столбцы и домены. Дополнительные сведения см. в статье Create a Matching Policy.

Дополнительные сведения о базах знаний см. в разделе DQS Knowledge Bases and Domains.

Описание задачи Раздел
Объедините внешние данные с данными, управляемыми MDS, и подготовьтесь к их сравнению. Объединение данных (надстройка MDS для Excel)
Воспользуйтесь базой набора знаний служб DQS для определения схожести данных. Сопоставление схожих данных (надстройка MDS для Excel)