Data Profiling Task Editor (Profile Requests Page)
適用対象: SQL Server
Azure Data Factory の SSIS 統合ランタイム
[データ プロファイル タスク エディター] の [プロファイル要求] ページを使用すると、計算するプロファイルを選択および構成することができます。 単一のデータ プロファイル タスクで、複数のテーブルまたはビューの複数の列または列の組み合わせに対して複数のプロファイルを計算することができます。
データ プロファイル タスクの使用方法の詳細については、「 データ プロファイル タスクのセットアップ」を参照してください。 Data Profile Viewer を使用してデータ プロファイル タスクの出力を分析する方法の詳細については、「 Data Profile Viewer」を参照してください。
[データ プロファイル タスク エディター] の [プロファイル要求] ページを開くには
SQL Server Data Tools (SSDT)で、データ プロファイル タスクを含む Integration Services パッケージを開きます。
[制御フロー] タブで、データ プロファイル タスクをダブルクリックします。
[データ プロファイル タスク エディター]で、 [プロファイル要求]をクリックします。
要求ペインの使用
要求ペインは、ページの最上部に表示されるペインです。 このペインには、現在のデータ プロファイル タスク用に構成されているすべてのプロファイルが表示されます。 構成済みのプロファイルが存在しない場合、要求ペインには何も表示されません。 新しいプロファイルを追加するには、 [プロファイルの種類] 列の下の空白領域をクリックし、一覧からプロファイルの種類を選択します。 プロファイルを構成するには、要求ペインでプロファイルを選択し、 [要求プロパティ] ペインでプロファイルのプロパティを設定します。
要求ペインのオプション
要求ペインには次のオプションがあります。
表示
データ プロファイル タスク用に構成されているすべてのプロファイルを表示するか、または 1 つのプロファイルだけを表示するかを選択します。
要求ペインに表示される列は、選択した [表示] に応じて異なります。 各列の詳細については、次のセクション「要求ペインの列」を参照してください。
要求ペインの列
要求ペインに表示される列は、選択した [表示] に応じて異なります。
[すべての要求]を表示するように選択した場合は、 [プロファイルの種類] および [要求 ID]の 2 つの列が要求ペインに表示されます。
5 つの列プロファイルのうちの 1 つを表示するように選択した場合は、 [プロファイルの種類]、 [テーブルまたはビュー]、 [列]、および [要求 ID]の 4 つの列が要求ペインに表示されます。
候補キー プロファイルを表示するように選択した場合は、 [プロファイルの種類]、 [テーブルまたはビュー]、 [キー列]、および [要求 ID]の 4 つの列が要求ペインに表示されます。
機能依存プロファイルを表示するように選択した場合は、 [プロファイルの種類]、 [テーブルまたはビュー]、 [決定列]、 [依存列]、および [要求 ID]の 5 つの列が要求ペインに表示されます。
値包含プロファイルを表示するように選択した場合は、 [プロファイルの種類]、 [サブセット側のテーブルかビュー]、 [スーパーセット側のテーブルまたはビュー]、 [サブセット側の列]、 [スーパーセット側の列]、および [要求 ID]の 6 つの列が要求ペインに表示されます。
次のセクションで、これらの各列について説明します。
すべてのビューに共通の列
[プロファイルの種類]
次のオプションからデータ プロファイルを選択します。
値 | 説明 |
---|---|
[候補キー プロファイル要求] | 候補キー プロファイルを計算します。 このプロファイルは、列または列のセットが、選択したテーブルのキーまたは近似キーであるかどうかを報告します。 また、このプロファイルを使用すると、キーとなる可能性がある列の重複値などのデータの問題を特定できます。 |
[列長分布プロファイル要求] | 列長分布プロファイルを計算します。 列長分布プロファイルは、選択された列に含まれる文字列値の長さごとに、その長さと、テーブル内におけるその長さの行の比率を報告します。 このプロファイルを使用すると、無効な値などのデータの問題を特定できます。 たとえば、2 文字の米国州コードの列をプロファイルし、3 文字以上の値を検出できます。 |
[列の NULL 比プロファイル要求] | 列の NULL 比プロファイルを計算します。 列の NULL 比プロファイルは、選択した列の NULL 値の比率を報告します。 このプロファイルを使用すると、列の NULL 値の比率が予想外に高いなどのデータの問題を特定できます。 たとえば、郵便番号列をプロファイルすると、許容範囲を超える欠落した郵便番号の比率を検出できます。 |
[列パターン プロファイル要求] | 列パターン プロファイルを計算します。 列パターン プロファイルは、文字列型の列に含まれる指定された比率の値に対応する一連の正規表現を報告します。 このプロファイルを使用すると、無効な文字列などのデータの問題を特定できます。 また、このプロファイルには、新しい値を検証するために将来使用できる正規表現も提示されます。 たとえば、郵便番号列のパターン プロファイルでは、\d{5}-\d{4}、\d{5}、および \d{9} という正規表現が生成されます。 その他の正規表現が示された場合、データに無効な値または形式が正しくない値が含まれている可能性があります。 |
[列統計プロファイル要求] | 選択したテーブルまたはビュー内のすべての該当する列に対して既定の設定を使用して列統計プロファイルを計算するには、このオプションを選択します。 列統計プロファイルは、数値型列の最小値、最大値、平均値、標準偏差や、 datetime 列の最小値、最大値などの統計を報告します。 このプロファイルを使用すると、無効な日付などのデータの問題を特定できます。 たとえば、履歴の日付の列をプロファイルし、将来の日付の最大値を検出できます。 |
[列の値分布プロファイル要求] | 列の値分布プロファイルを計算します。 列の値分布プロファイルは、選択された列に含まれるすべての異なる値と、それぞれの値が表す行のテーブル内での比率を報告します。 また、テーブル内の指定された比率を超えている値も報告できます。 このプロファイルを使用すると、列に含まれる個別の値の数が正しくないなどのデータの問題を特定できます。 たとえば、米国の州を含む列をプロファイルし、50 個を超える個別の値を検出できます。 |
[機能依存プロファイル要求] | 機能依存プロファイルを計算します。 機能依存プロファイルは、ある列 (依存列) の値が別の列または列のセット (決定列) の値にどの程度依存しているかを報告します。 このプロファイルを使用すると、無効な値などのデータの問題を特定できます。 たとえば、米国郵便番号を含む列と米国の州を含む列の間の依存関係をプロファイルできます。 郵便番号によって州が一意に決定されますが、このプロファイルでは、この依存関係の違反を検出できます。 |
[値包含プロファイル要求] | 値包含プロファイルを計算します。 値包含プロファイルは、2 つの列間または列のセット間の値の重複を計算します。 また、このプロファイルでは、列または列のセットが、選択したテーブル間の外部キーとして適しているかどうかを判断できます。 このプロファイルを使用すると、無効な値などのデータの問題を特定できます。 たとえば、Sales テーブルの ProductID 列をプロファイルし、この列に Products テーブルの ProductID 列には存在しない値が含まれていることを検出できます。 |
RequestID
要求の識別子が表示されます。 通常、自動生成された値を変更する必要はありません。
個々のプロファイルすべてに共通の列
接続マネージャー
ソース データベースに接続する ADO.NET 接続マネージャーが表示されます。
要求 ID
要求の識別子が表示されます。 通常、自動生成された値を変更する必要はありません。
5 つの個々の列プロファイルに共通の列
[テーブルまたはビュー]
選択した列を含むテーブルまたはビューが表示されます。
列
選択したプロファイル対象の列が表示されます。
候補キー プロファイルに固有の列
[テーブルまたはビュー]
選択した列を含むテーブルまたはビューが表示されます。
[キー列]
選択したプロファイル対象の列が表示されます。
機能依存プロファイルに固有の列
[テーブルまたはビュー]
選択した列を含むテーブルまたはビューが表示されます。
[決定列]
プロファイル対象の決定列として選択した列が表示されます。 米国郵便番号によって米国の州が決定される例の場合、決定列は郵便番号列です。
Dependent column
プロファイル対象の依存列として選択した列が表示されます。 米国郵便番号によって米国の州が決定される例の場合、依存列は州列です。
値包含プロファイルに固有の列
[サブセット側のテーブルかビュー]
サブセット側の列として選択した列を含むテーブルまたはビューが表示されます。
[スーパーセット側のテーブルまたはビュー]
スーパーセット側の列として選択した列を含むテーブルまたはビューが表示されます。
[サブセット側の列]
プロファイル対象のサブセット側の列として選択した列が表示されます。 米国の州の列の値が 2 文字の米国州コードの参照テーブルに存在することを確認する例では、ソース テーブルの州列がサブセット列になります。
[スーパーセット側の列]
プロファイル対象のスーパーセット側の列として選択した列が表示されます。 米国の州の列の値が 2 文字の米国州コードの参照テーブルに存在することを確認する例では、参照テーブルの州コードの列がスーパーセット列になります。
[要求プロパティ] ペインの使用
[要求プロパティ] ペインは要求ペインの下に表示されます。 このペインには、要求ペインで選択したプロファイルのオプションが表示されます。
注意
プロファイル要求のプロパティを [要求プロパティ]ペインに表示するには、 [プロファイルの種類] を選択した後で [要求 ID] フィールドを選択する必要があります。
これらのオプションは、選択したプロファイルによって異なります。 個々のプロファイルの種類にあるオプションの詳細については、次のトピックを参照してください。
参照
[データ プロファイル タスク エディター] ([全般] ページ)
[単一テーブル クイック プロファイル フォーム] (データ プロファイル タスク)