[あいまいグループ化変換エディター] ([列] タブ)
[あいまいグループ化変換エディター] ダイアログ ボックスの [列] タブを使用すると、重複する値を持つ行をグループ化するための列を指定できます。
あいまいグループ化変換の詳細については、「 Fuzzy Grouping Transformation」を参照してください。
オプション
使用できる入力列
重複する値を持つ行をグループ化するために使用する入力列を、この一覧から選択します。
名前
使用できる入力列の名前を表示します。
[パススルー]
入力列を変換の出力に含めるかどうかを選択します。 グループ化に使用されるすべての列は、自動的に出力にコピーされます。 この列を選択することによって、追加の列を含めることができます。
入力列
[使用できる入力列] の一覧で選択されている入力列の 1 つを選択します。
[出力の別名]
対応する出力列に付けるわかりやすい名前を入力します。 既定では、出力列名は入力列名と同じになります。
[グループ出力の別名]
グループ化された重複の標準の値を含む列に付けるわかりやすい名前を入力します。 この出力列の既定の名前は、入力列名に _clean を付けた名前です。
[一致の種類]
あいまい一致と完全一致のどちらかを指定します。 あいまい一致の場合、行は、すべての列にわたって行が十分に類似している場合に重複していると見なされます。 さらに、特定の列に対して完全一致を指定した場合、完全一致列内で同一の値を含む行だけが、重複の可能性があると見なされます。 したがって、特定の列にエラーや矛盾がないことがわかっている場合は、その列に対して完全一致を指定して、他の列でのあいまい一致の精度を高めることができます。
[最小類似]
スライダーを使用して、類似のしきい値を結合レベルで設定します。 値を 1 に近づけるほど、参照元の値と参照先の値との類似性が高くなければ一致しないと見なされます。 しきい値を大きくすると、照合の対象となるレコードが少なくなるため、照合の速度が向上します。
[類似出力の別名]
選択された結合の類似スコアを格納する、新しい出力列に付ける名前を指定します。 この値を空にした場合、出力列は作成されません。
[数字]
列データを比較する際の先頭および末尾の数字の有意性を指定します。 たとえば、先頭の数字が有意である場合、"123 Main Street" は "456 Main Street" と同じグループとは見なされません。
値 | 説明 |
---|---|
どちらもオフ | 先頭および末尾の数字は考慮されません。 |
[Leading] | 先頭の数字のみが考慮されます。 |
[Trailing] | 末尾の数字のみが考慮されます。 |
[Leading and Trailing] | 先頭および末尾の両方の数字が考慮されます。 |
[比較フラグ]
文字列比較オプションについては、「 文字列データの比較」を参照してください。
参照
Integration Services のエラーおよびメッセージのリファレンス
あいまいグループ化変換を使用して類似のデータ行を識別する