Поделиться через


Создание составного домена

Область применения:SQL Server

В этом разделе описывается, как создать составной домен в базе знаний в Службах качества данных (DQS). Составной домен состоит из нескольких отдельных доменов, применимых к одному полю данных. Дополнительные сведения о составных доменах см. в разделе Управление составным доменом.

Существуют два способа создания нового составного домена. Первый — на этапе сопоставления в процессе обнаружения знаний, когда вы анализируете образец данных для добавления знаний в новую или существующую базу знаний. Второй — в ходе действий по управлению доменами, когда вместо изменения существующего домена вы создаете новый. Чтобы создать составной домен, необходимо предварительно создать не менее двух отдельных доменов, которые будут добавляться в составной домен. При создании нового составного домена доступны только предварительно созданные отдельные домены, которые еще не добавлены к существующим составным доменам. Отдельный домен можно добавить только к одному составному домену. Составной домен невозможно добавить в другой составной домен.

После создания составного домена можно изменить его свойства, присоединить к домену службы ссылочных данных, создать междоменные правила или связи значений. Для этого выберите составной домен в списке Домен на странице Управление доменами и перейдите на соответствующую вкладку.

Перед началом

Предварительные условия

Чтобы создать составной домен, необходимо предварительно создать и открыть базу знаний, также необходимо предварительно создать не менее двух отдельных доменов, которые будут добавляться в составной домен.

Безопасность

Разрешения

Для создания составного домена необходимо иметь роль dqs_kb_editor или dqs_administrator в базе DQS_MAIN.

Создание составного домена в ходе действия обнаружения знаний

  1. Запустите клиент обеспечения качества данных. Для получения информации об этом см. раздел "Запуск клиентского приложения для обеспечения качества данных".

  2. На домашнем экране клиента качества данных нажмите кнопку "Открыть база знаний", а затем выберите база знаний или нажмите кнопку "Создать база знаний" и введите свойства для нового база знаний.

  3. Выберите действие Обнаружение знаний и нажмите кнопку Создать , чтобы создать новую базу знаний, или нажмите кнопку Открыть , чтобы открыть существующую базу знаний.

  4. На странице Карта укажите соединение с источником данных. Дополнительные сведения см. в разделе Perform Knowledge Discovery.

  5. В таблице Сопоставления выберите исходный столбец из раскрывающегося списка для столбца Исходный столбец пустой строки. Убедитесь, что исходный столбец содержит составной домен, состоящий из двух существующих отдельных доменов. Если соответствующих отдельных доменов не существует, щелкните значок Создать домен .

  6. В таблице Сопоставления выберите исходный столбец из раскрывающегося списка для столбца Исходный столбец пустой строки. Убедитесь, что исходный столбец содержит составной домен, на части которого указывают два существующих отдельных домена. Если соответствующих отдельных доменов не существует, щелкните значок Создать домен , чтобы создать эти домены. Дополнительные сведения см. в статье Создание домена.

  7. Щелкните значок Создать составной домен .

Создание составного домена в ходе действия по управлению доменами

  1. На главной странице клиента Data Quality Services щелкните Открыть базу знаний и выберите базу знаний или щелкните Новая база знаний и введите свойства новой базы знаний.

  2. Выберите действие Управление доменами и нажмите кнопку Создать , чтобы создать новую базу знаний, или нажмите кнопку Открыть , чтобы открыть существующую базу знаний.

  3. Убедитесь, что существуют несколько доменов, необходимых для составного домена. В противном случае щелкните значок Создать домен и создайте его. Дополнительные сведения см. в статье Создание домена.

  4. На странице Управление доменами щелкните значок Создать составной домен , расположенный над списком доменов.

  5. Введите имя, которое является уникальным в базе знаний, и описание длиной до 256 символов.

  6. В Списке доменоввыберите домены, которые будут входить в состав составного домена, и щелкните стрелку вправо, чтобы переместить эти домены в таблицу Домены в составном домене .

  7. Щелкните OK.

Установка свойств составного домена

  1. В диалоговом окне Создание составного домена введите имя, которое является уникальным в базе знаний, и описание длиной до 256 символов.

  2. В Списке доменоввыберите домены, которые будут входить в состав составного домена, и щелкните стрелку вправо, чтобы переместить эти домены в таблицу Домены в составном домене . Это список отдельных доменов, доступных для добавления в создаваемый составной домен. Доступны только предварительно созданные отдельные домены, которые еще не добавлены к существующим составным доменам. Отдельный домен можно добавить только к одному составному домену в базе знаний. Составной домен невозможно добавить в другой составной домен.

  3. Щелкните Дополнительно.

  4. Выберите одно из следующих значений для параметра Метод анализа:

    • Ссылочные данные. Анализ значений поля в соответствии с форматом данных в службе ссылочных данных (RDS). Службы Data Quality Services передают значения из составного домена в RDS, и RDS возвращает исправленные и проанализированные данные в соответствии с этими доменами.

    • В порядке. Анализ значений поля в соответствии с порядком доменов в составном домене. Первое значение включается в первый домен, второе значение во вторые домены и так далее.

    • Разделители. Анализ значений поля на основе разделителя, выбранного с помощью переключателей, которые отображаются после выбора параметра "Разделители". Возможные разделители: Таб, Точка с запятой, Запятая, Пробел, или Другое. Если выбран разделитель Другое, введите значение, которое будет служить в качестве разделителя.

  5. Если в качестве метода анализа выбрано Разделители , вы можете также установить флажок Использовать анализ на основе знаний. Дополнительные сведения см. в статье Knowledge-Based Parsing.

  6. Нажмите кнопку Готово , чтобы завершить операцию управления доменами, как описано в разделе Завершение операции по управлению доменами.

Дальнейшие действия. После создания составного домена

После создания составного домена можно выполнить другие задачи по управлению для этого домена, провести обнаружение знаний для добавления набора знаний в домен или добавить в домен политику сопоставления. Дополнительные сведения см. в разделах Обнаружение набора знаний, Управление доменом и Создание политики сопоставления.

Разбор на основе знаний

Службы Data Quality Services позволяют анализировать данные на основе набора знаний, а не в зависимости от разделителя или порядка. Анализ на основе знаний используется при сопоставлении сложных исходных данных с составным доменом, если при этом не используются службы ссылочных данных. Анализ на основе знаний вы можете использовать для выполнения анализа данных из источника данных по соответствующим отдельным доменам. С помощью парсинга на основе знаний DQS сначала пытается использовать знания, чтобы разобрать сложные данные на отдельные домены. Если возможно, он определяет части строки как принадлежащие одному или нескольким доменам и разбирает строку на её различные домены. Представьте себе, что у вас есть "John B. Doe" в качестве сложного значения в поле полного имени, представленного составным доменом "Полное имя". Если DQS идентифицирует "John" в домене имени и "Doe" в домене фамилии, то DQS добавит "B." в домен отчества на основе знаний о домене.

Анализ на основе знаний вы можете использовать только в том случае, если выбран анализ на основе разделителей. Анализ на основе знаний не заменяет анализ на основе разделителей, но дополняет его. Только при отсутствии знаний для этого DQS использует разделитель для анализа. В некоторых случаях DQS может определить анализ с использованием знаний, а затем определить другой анализ с использованием разделителя.

Анализ на основе знаний можно использовать в случаях, когда составной домен состоит из доменов строк или если составной домен состоит из различных типов доменов (int, date, time и др.). Если источник данных состоит из данных различного типа, то сначала следует выделить нестроковые типы данных, а затем выполнить анализ остальных данных на основе набора знаний домена, как описано выше.

При использовании анализа на основе знаний, если количество значений в исходных данных меньше количества доменов в составном домене, DQS размещает в отсутствующих доменах значения NULL. Если количество значений в исходных данных превышает количество доменов в составном домене, DQS добавляет в один из столбцов дополнительные данные. Если несколько доменов содержат одинаковые значения, источник данных будет обработан для первого совпавшего домена.