[あいまいグループ化変換エディター] ( タブ)
[あいまいグループ化変換エディター] ダイアログ ボックスの [詳細設定] タブを使用すると、入力列と出力列の指定、類似性のしきい値の設定、区切り記号の定義ができます。
注 |
---|
あいまいグループ化変換の Exhaustive プロパティおよび MaxMemoryUsage プロパティは、[あいまいグループ化変換エディター] ではアクセスできませんが、[詳細エディター] を使用して設定できます。 これらのプロパティの詳細については、「変換のカスタム プロパティ」の「あいまいグループ化変換」を参照してください。 |
あいまいグループ化変換の詳細については、「あいまいグループ化変換」を参照してください。
オプション
[入力キー列名]
各入力行の一意の識別子を含む、出力列の名前を指定します。 [_key_in] 列は各行を一意に識別する値を持ちます。[出力キー列名]
重複する行グループの正規行の一意識別子を含む、出力列の名前を指定します。 [_key_out] 列は、正規データ行の _key_in 値に対応します。[類似性スコアの列名]
類似性スコアを含む列の名前を指定します。 類似性スコアは、正規行に対する入力行の類似性を示す、0 ~ 1 の間の値です。 スコアが 1 に近づくほど、正規行とより類似します。[類似性のしきい値]
スライダーを使用して類似性のしきい値を設定します。 しきい値が 1 に近づくと、より類似性が高い行どうしのみが重複として扱われるようになります。 しきい値を増加させると候補レコードとして処理対象になる数が少なくなるため、一致処理の速度が向上します。[トークン区切り記号]
変換により、トークンにするデータの区切り記号の既定のセットが提供されます。必要に応じて、一覧を編集して区切り記号の追加や削除を行うことができます。