Compartir a través de


Editor de transformación Agrupación aproximada (pestaña Avanzadas)

Use la pestaña Avanzadas del cuadro de diálogo Editor de transformación Agrupación aproximada para especificar las columnas de entrada y salida, configurar umbrales de similitud y definir delimitadores.

Nota:

Las Exhaustive propiedades y MaxMemoryUsage de la transformación Agrupación aproximada no están disponibles en el Editor de transformación Agrupación aproximada, pero se pueden establecer mediante el Editor avanzado. Para obtener más información acerca de estas propiedades, vea la sección sobre la transformación Agrupación aproximada en Transformation Custom Properties.

Para obtener más información acerca de la transformación Agrupación aproximada, vea Fuzzy Grouping Transformation.

Opciones

Nombre de la columna de clave de entrada
Especifique el nombre de una columna de salida que contenga el identificador único para cada fila de entrada. La columna _key_in tiene un valor que identifica de forma exclusiva cada fila.

Nombre de la columna de clave de salida
Especifique el nombre de una columna de salida que contenga el identificador único para la fila canónica de un grupo de filas duplicadas. La columna _key_out se corresponde con el valor _key_in de la fila de datos canónica.

Nombre de la columna de resultados de similitud
Especifique un nombre para la columna que contiene los resultados de similitud. Los resultados de similitud tienen un valor entre 0 y 1 que indica la similitud de la fila de entrada con la fila canónica. Cuanto más se acerque el resultado a 1, mayor será la coincidencia entre la fila y la fila canónica.

Umbral de similitud
Defina el umbral de similitud utilizando el control deslizante. Cuanto más se acerque el umbral a 1, más deberán parecerse las filas entre sí para ser consideradas duplicados. Aumentar el umbral puede mejorar la velocidad de coincidencia, ya que tendrán que tenerse en cuenta menos registros candidatos.

Delimitadores de token
La transformación proporciona un conjunto predeterminado de delimitadores para dividir los datos en tokens, pero se pueden agregar o quitar los delimitadores que sea necesario editando la lista.

Vea también

Referencia de errores y mensajes de Integration Services
Identificar filas de datos similares mediante la transformación Agrupación aproximada