Поделиться через


Добавление знаний в базу знаний

Область применения: SQL Server

В этом разделе описываются способы добавления знаний в база знаний в службах качества данных (DQS). Прежде чем приступать к работе со службами DQS, необходимо получить набор знаний о данных. Для этого необходимо построить и поддерживать базу знаний служб DQS, а также пополнять ее наборами знаний, связанными с соответствующими типами источников данных. База знаний является репозиторием знаний о данных, который дает представление о данных и помогает поддерживать их целостность.

База знаний содержит домены данных, связанные с источником данных. Для каждого домена данных в базе знаний служб DQS (DQKB) хранятся идентифицированные термины, орфографические ошибки, правила проверки и бизнес-правила, а также справочные данные, которые могут использоваться для выполнения действий со службами DQS на источнике данных. В службах DQS эти знания используются для выявления неправильных или недопустимых данных, либо для сопоставления.

Добавлять знания в базу знаний вы можете приведенными ниже автоматическими и ручными способами.

Обнаружение набора знаний

В процессе обнаружения знаний образец данных анализируется на соответствие критериям DQS, затем полученные знания добавляются в базу знаний. Это изменяющий данные автоматизированный процесс, при котором обнаруживаются несоответствия и синтаксические ошибки в данных. Действие по обнаружению знаний выполняется мастером, который представляет собой страницу для интерактивного управления значениями домена.

  • Дополнительные сведения в документации см. в разделе Perform Knowledge Discovery.

  • Чтобы просмотреть видео, в котором показано обнаружение знаний, щелкните здесь.

Управление значениями данных в домене

В службах DQS предусмотрено интерактивное изменение и пополнение метаданных, создаваемых в процессе автоматизированного обнаружения знаний. Это выполняется в действии «Управление доменами», когда изменение можно применить к конкретному значению данных.

  • Дополнительные сведения в документации см. в разделе Change Domain Values.

  • Чтобы просмотреть видео, в котором показано управление доменами, щелкните здесь. Обратите внимание, что в этом видео значения домена изменяются на странице «Управление значениями домена» в мастере «Обнаружение знаний». Кроме того, эти шаги можно выполнить на странице «Значения домена» действия «Управление доменами».

Импорт набора знаний из файла .dqs

Вы можете как импортировать домен из файла .dqs в существующую базу знаний, так и импортировать базу знаний целиком из файла .dqs в новую базу знаний. Для этого нужно сначала экспортировать существующий домен или базу знаний в файл .dqs. Файл .dqs с доменом содержит все данные этого домена. Файл .dqs с базой знаний содержит все сведения из этой базы знаний, в том числе домены и политику сопоставления.

Импорт набора знаний из файла Excel

Вы можете импортировать значения домена из файла электронной таблицы Excel в существующий домен или базу знаний. Для этого необходимо сначала создать электронную таблицу Excel со значениями домена, которые требуется импортировать, и убедиться, что Excel установлен на клиентском компьютере клиента data Quality, чтобы вы могли импортировать значения с помощью клиента качества данных. Нельзя экспортировать значения домена из домена или базы знаний в файл Excel.

Импорт знаний из проекта обратно в базу знаний

После выполнения очистки или сопоставления в проекте DQS с использованием базы знаний можно импортировать знания, полученные во время проверки или сопоставления, обратно в базу. Это позволяет сохранять набор знаний, полученные в ходе осуществления проекта, а также постоянно накапливать наборы знаний в базе знаний.

Использование базы знаний DQS по умолчанию

Службы DQS поставляются с предварительно созданной базой знаний, известной как «Данные служб DQS», содержащей домены для данных о компаниях и адресах США. С помощью этой базы знаний можно быстро начать проект, не создавая новую базу знаний. База знаний «Данные служб DQS» доступна только для чтения, но на ее основе диспетчер данных может создать новую базу знаний.