次の方法で共有


参照データへのドメインと複合ドメインのアタッチ

このトピックでは、データ品質ナレッジ ベースのドメインと複合ドメインを Windows Azure Marketplace の参照データ サービスにアタッチして、高品質参照データに対するナレッジを構築する方法について説明します。 各参照データ サービスには、スキーマ (データ列) が含まれています。 ドメインまたは複合ドメインを参照データ サービスにアタッチしたら、アタッチしたドメインまたはアタッチした複合ドメイン内の個々のドメインを参照データ サービス スキーマの適切な列にマップする必要があります。 複合ドメインを参照データ サービスにアタッチすると、参照データ サービスに 1 つだけドメインをアタッチして、複合ドメイン内の個々のドメインを参照データ サービス スキーマの適切な列にマップできます。

注記注意

参照データ サービスにアタッチされた複合ドメインは、ドメインを参照データ サービス スキーマの列にマップするときに、ドメインのドロップダウン リストで使用できます。 複合ドメインを参照データ サービス スキーマの列にマップしないでください。複合ドメイン内の個々のドメインのみを参照データ サービス スキーマの適切な列にマップする必要があります。 それ以外の場合、エラーが発生します。

参照データ サービス スキーマには、参照データ サービスを使用する場合に適切なドメインにマップする必要がある必須列が含まれている場合があります。 参照データ スキーマの必須列には列名に "(M)" と表示されます。 たとえば、AddressLineMelissa Data – Address Data の必須スキーマ列で、CompanyNameDigital Trowel Inc. – Us companies and professional data for SQL users の必須スキーマ列です。

このトピックでは、複合ドメイン Address Verification に 4 つのドメイン (Address LineCityState、および Zip) を作成し、複合ドメインを Melissa Data – Address Check 参照データ サービスにアタッチした後、複合ドメイン内の個々のドメインを参照データ サービス スキーマの適切な列にマップします。

このトピックの内容

  • 作業を開始する準備:

    前提条件

    セキュリティ

  • Melissa Data の参照データへのドメインのマップ

  • 補足情報: 参照データにドメインをマップした後

作業を開始する準備

前提条件

参照データ サービスを使用するように Data Quality Services (DQS) を構成しておく必要があります。 「参照データを使用する DQS の構成」を参照してください。

セキュリティ

権限

参照データにドメインをマップするには、DQS_MAIN データベースの dqs_kb_editor ロールが必要です。

[トップに戻る] リンクで使用される矢印アイコン[先頭に戻る]

Melissa Data の参照データへのドメインのマップ

  1. Data Quality クライアントを開始します。詳細については、以下を参照してください。 Data Quality Client アプリケーションの実行.

  2. Data Quality クライアント のホーム画面で、[ナレッジ ベース管理][新しいナレッジ ベース] をクリックします。

  3. [新しいナレッジ ベース] 画面で、新しいナレッジ ベースの名前を入力し、[ドメイン管理] アクティビティをクリックして [作成] をクリックします。

  4. [ドメイン管理] 画面で、[ドメインの作成] アイコンをクリックしてドメインを作成します。 作成するドメインは、Address LineCityState、および Zip の 4 つです。

  5. [複合ドメインの作成] アイコンをクリックして複合ドメインを作成します。 [複合ドメインの作成] ダイアログ ボックスで、[複合ドメイン名] ボックスに「Address Verification」と入力し、手順 3. で作成したすべてのドメインを複合ドメインに含めます。 [OK] をクリックします。

  6. 左側の [ドメイン] ペインで、[Address Verification] をクリックして複合ドメインを選択し、右側の [参照データ] タブをクリックします。

  7. [参照] アイコンをクリックします。

  8. [オンライン参照データ プロバイダーのカタログ] ダイアログ ボックスで以下を行います。

    1. [DataMarket Data Quality Services][メリッサ データ – アドレスをチェック] ボックスを選択します。

    2. Melissa Data – Address Check 参照データ サービスの列を適切なドメイン (Address Line、City、State、および Zip) にマップします。 列をマップするには、[RDS スキーマ] 列で参照データ サービス列を選択し、[ドメイン] 列で適切なドメインを選択します。 テーブルに行を追加するには、[スキーマ エントリの追加] アイコンをクリックします。

    3. [OK] をクリックして変更を保存し、[オンライン参照データ プロバイダーのカタログ] ダイアログ ボックスを閉じます。

      [オンライン参照データ プロバイダーのカタログ] ダイアログ ボックス

      注意
      • [オンライン参照データ プロバイダーのカタログ] ダイアログ ボックスでは、Windows Azure Marketplace でサブスクライブしているすべての参照データ サービス プロバイダーが [DataMarket Data Quality Services] ノードに表示されます。 ダイレクト オンライン サード パーティ参照データ サービス プロバイダーを DQS で構成している場合は、[サード パーティのダイレクト オンライン プロバイダー] という別のノードに表示されます (ここでは、ダイレクト オンライン サード パーティ参照データ サービス プロバイダーを DQS で構成していないため表示されません)。

  9. [参照データ] タブに戻ります。 [プロバイダーの設定] 領域で、必要に応じて以下のボックスの値を変更します。

    • [自動修正しきい値]: 参照データ サービスの修正のうち、信頼レベルがこのしきい値を超える修正は自動的に実行されます。 割合値に相当する値を 10 進数表記で入力します。 たとえば、90% であれば「0.9」と入力します。

    • [提案された候補]: 参照データ サービスから提案された候補を表示する数です。

    • [最小信頼度]: 参照データ サービスの提案のうち、信頼レベルがこの値に満たない提案は無視されます。 割合値に相当する値を 10 進数表記で入力します。 たとえば、60% であれば「0.6」と入力します。

  10. [完了] をクリックしてナレッジ ベースを発行します。 ナレッジ ベースが正常に発行されると、確認のメッセージが表示されます。

このナレッジ ベースをデータ品質プロジェクトのクレンジング アクティビティに使用できるようになりました。Windows Azure Marketplace を通じて Melissa Data から提供されるナレッジに基づいて、ソース データに含まれる米国の住所を標準化およびクレンジングできます。

[トップに戻る] リンクで使用される矢印アイコン[先頭に戻る]

補足情報: 参照データにドメインをマップした後

データ品質プロジェクトを作成し、このトピックで作成したナレッジ ベースと照らし合わせて、米国の住所を含むソース データに対するクレンジング アクティビティを実行します。 「参照データ (外部) のナレッジを使用したデータのクレンジング」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[先頭に戻る]

関連項目

概念

DQS の参照データ サービス

データ クレンジング