次の方法で共有


ナレッジ ベースへのナレッジの追加

このトピックでは、Data Quality Services (DQS) のナレッジ ベースにナレッジを追加する方法について説明します。 データ品質操作を実行するには、データに関するナレッジを事前に用意しておく必要があります。 このナレッジを取得するには、データ品質ナレッジ ベースを構築および管理し、特定の種類のデータ ソースに関連するナレッジをそのナレッジベースに追加します。 ナレッジ ベースはデータに関するナレッジのリポジトリです。ナレッジ ベースを使用して、データを理解し、その整合性を維持できます。

ナレッジ ベースには、データ ソースに関連するデータ ドメインが含まれています。 各データ ドメインでは、ナレッジ ベースに、データ ソースに対するデータ品質操作の実行に使用できる識別された用語、スペル ミス、検証ルールとビジネス ルール、および参照データがすべて格納されます。 DQS は、正しくないデータまたは無効なデータの識別や照合の実行にこのナレッジを使用します。

ナレッジは、次に示すコンピューター支援型または対話型の手法でナレッジ ベースに追加できます。

  • ナレッジ検出の実行

  • ドメイン内のデータ値の管理

  • .dqs ファイルからのナレッジのインポート

  • Excel ファイルからのナレッジのインポート

  • クレンジング プロジェクトからナレッジ ベースへのナレッジの再インポート

  • 既定の DQS ナレッジ ベースの使用

ナレッジ検出の実行

ナレッジ検出では、データ品質基準を取得するためにデータのサンプルを分析し、取得したナレッジをナレッジ ベースに追加します。 これは、データの不整合と構文エラーを識別し、データへの変更を提案するコンピューター支援型のプロセスです。 ナレッジ検出アクティビティは、ドメイン値を対話的に管理できるページを含むウィザードです。 詳細については、「ナレッジ検出の実行」を参照してください。

ドメイン内のデータ値の管理

DQS では、コンピューター支援型のナレッジ検出アクティビティで生成されたメタデータを対話的に変更および拡張することができます。 これはドメイン管理アクティビティで行います。ドメイン管理アクティビティでは、特定のデータ値に変更を適用することができます。

  • ドキュメント化された詳細情報については、「ドメイン値の変更」を参照してください。

  • ドメイン管理の実行方法を示すビデオについては、ここをクリックしてください。 このビデオでは、ナレッジ検出ウィザードの [ドメイン値の管理] ページでドメイン値を変更します。 この手順は、ドメイン管理アクティビティの [ドメイン値] ページでも行うことができます。

.dqs ファイルからのナレッジのインポート

.dqs データ ファイルから既存のナレッジ ベースにドメインをインポートしたり、.dqs から新しいナレッジ ベースにナレッジ ベース全体をインポートしたりできます。 これを行うには、まず既存のドメインまたはナレッジ ベースを .dqs ファイルにエクスポートする必要があります。 ドメインを含む .dqs ファイルには、ドメインのすべてのデータが格納されています。ナレッジ ベースを含む .dqs ファイルには、ドメインや照合ポリシーを含むナレッジ ベースのすべての情報が格納されています。

Excel ファイルからのナレッジのインポート

Excel スプレッドシート ファイルから既存のドメインまたはナレッジ ベースにドメイン値をインポートできます。 これを行うには、まずインポートするドメイン値を含む Excel スプレッドシートを作成し、Data Quality クライアント を使用して値をインポートできるように Excel が Data Quality クライアント コンピューターにインストールされていることを確認する必要があります。 ドメインまたはナレッジ ベースから Excel ファイルにドメイン値をエクスポートすることはできません。

クレンジング プロジェクトからナレッジ ベースへのナレッジの再インポート

ナレッジ ベースを使用してクレンジング データ品質プロジェクトを実行した後、クレンジング中に作成されたナレッジをそのナレッジ ベースに再インポートできます。 これにより、プロジェクト中に生成されたナレッジを保持し、ナレッジ ベースにナレッジを継続的に構築することができます。

既定の DQS ナレッジ ベースの使用

DQS には、DQS データと呼ばれる構築済みのナレッジ ベースが同梱されています。このナレッジ ベースには、米国の会社および住所データのドメインが含まれています。 このナレッジ ベースを使用すると、新しいナレッジ ベースを作成することなく、プロジェクトをすばやく開始できます。 DQS データ ナレッジ ベースは読み取り専用ですが、データ スチュワードはこれに基づいて新しいナレッジ ベースを作成できます。