Adjuntar un dominio o un dominio compuesto a datos de referencia: Data Quality Services (DQS)
Se aplica a: SQL Server
En este tema se describe cómo adjuntar dominios o dominios compuestos de una base de conocimiento de calidad de datos a un servicio de datos de referencia en Azure Marketplace para generar conocimiento con los datos de referencia de alta calidad. Cada servicio de datos de referencia contiene un esquema (columnas de datos). Después de adjuntar un dominio o un dominio compuesto a un servicio de datos de referencia, debe asignar el dominio adjunto o los dominios individuales dentro del dominio compuesto adjunto a las columnas adecuadas de un esquema del servicio de datos de referencia. Adjuntar un dominio compuesto a un servicio de datos de referencia permite adjuntar solo un dominio a un servicio de datos de referencia y, a continuación, asignar los dominios individuales incluidos en el dominio compuesto a las columnas adecuadas del esquema del servicio de datos de referencia.
Importante
En este artículo se mencionan algunos servicios de datos de referencia de terceros que anteriormente no estaban disponibles desde Azure DataMarket. DataMarket y Data Services (incluidos los datos de dirección de Melissa, por ejemplo), se suspendieron después del 31/12/2016. Como resultado, ya no se pueden ejecutar los ejemplos de este artículo con los servicios especificados de DataMarket. Sin embargo, se pueden usar los servicios de datos de referencia que están disponibles directamente en línea de los proveedores de datos de referencia de terceros.
Advertencia
El dominio compuesto adjunto a un servicio de datos de referencia está disponible en la lista desplegable de dominios al asignar dominios a las columnas del esquema del servicio de datos de referencia. No asigne el dominio compuesto a una columna del esquema del servicio de datos de referencia; solo debe asignar dominios individuales dentro de un dominio compuesto a las columnas adecuadas del esquema del servicio de datos de referencia. De lo contrario, se producirá un error.
Un esquema del servicio de datos de referencia puede tener una columna obligatoria que se debe asignar al dominio apropiado si decide usar el servicio de datos de referencia. La columna obligatoria de un esquema de datos de referencia se identifica mediante "(M)" en el nombre de columna. Por ejemplo, AddressLine es la columna de esquema obligatoria en Melissa Data - Address Data y CompanyName es la columna de esquema obligatoria en Digital Trowel Inc. - Us companies and professional data for SQL users.
En este tema, se crearán cuatro dominios: Address Line, City, State y Zip, bajo un dominio compuesto, Address Verification, se adjuntará el dominio compuesto al servicio de datos de referencia Melissa Data - Address Check y después se asignarán los dominios individuales dentro del dominio compuestas a las columnas adecuadas del esquema del servicio de datos de referencia.
Antes de empezar
Requisitos previos
Es necesario configurar Data Quality Services (DQS) para utilizar los servicios de datos de referencia. Vea Configurar DQS para usar datos de referencia.
Seguridad
Permisos
Debe disponer del rol dqs_kb_editor en la base de datos DQS_MAIN para asignar dominios a datos de referencia.
Asignar dominios a datos de referencia de Melissa Data
Inicie el cliente de calidad de datos. Para obtener información sobre cómo hacerlo, consulte Ejecución de la aplicación Data Quality Client.
En la página de inicio de Data Quality Client, en Administración de la base de conocimiento, haga clic en Nueva base de conocimiento.
En la pantalla Nueva base de conocimiento , escriba un nombre para la nueva base de conocimiento, haga clic en la actividad Administración de dominios y, por último, haga clic en Crear.
En la pantalla Administración de dominios , haga clic en el icono Crear un dominio para crear un dominio. Cree los cuatro dominios siguientes: Address line, City, Statey Zip.
Haga clic en el icono Crear un dominio compuesto para crear un dominio compuesto. En el cuadro de diálogo Crear un dominio compuesto , escriba Address Verification en el cuadro Nombre de dominio compuesto e incluya en el dominio compuesto todos los dominios creados en el paso 3. Haga clic en OK.
En el panel Dominio del lado izquierdo, seleccione el dominio compuesto haciendo clic en Address Verificationy, a continuación, haga clic en la pestaña Datos de referencia situada en el lado derecho.
Haga clic en el icono Examinar .
En el cuadro de diálogo Catálogo de proveedores de datos de referencia en línea :
En DataMarket Data Quality Services, active la casilla Melissa Data - Address Check.
Asigne las columnas del servicio de datos de referencia Melissa Data - Address Check a los dominios adecuados (Address Line, City, State y Zip). Para asignar las columnas, seleccione una columna del servicio de datos de referencia en la columna Esquema RDS y, a continuación, seleccione el dominio adecuado en la columna Dominio . Para agregar más filas a la tabla, haga clic en el icono Agregar entrada de esquema .
Haga clic en Aceptar para guardar los cambios y cerrar el cuadro de diálogo Catálogo de proveedores de datos de referencia en línea .
Nota:
- En el cuadro de diálogo Catálogo de proveedores de datos de referencia en línea , el nodo DataMarket Data Quality Services muestra todos los proveedores de servicios de datos de referencia a los que se ha suscrito en Azure Marketplace. Si ha configurado proveedores de servicios directos de datos de referencia de terceros en línea en DQS, estos aparecerán en otro nodo denominado Proveedores en línea directa de terceros (no disponible en este momento debido a que se ha configurado ningún proveedor de servicios directos de datos de referencia de terceros en línea en DQS).
Regresará a la pestaña Datos de referencia. En el área Configuración de proveedores, cambie los valores de los cuadros siguientes, si es necesario:
Umbral de corrección automática: las correcciones del servicio de datos de referencia con un nivel de confianza por encima de estos valores de umbral se llevan a cabo automáticamente. Escriba un valor en la notación decimal del valor de porcentaje correspondiente. Por ejemplo, escriba 0,9 para un porcentaje del 90%.
Candidatos sugeridos: el número de candidatos sugeridos que se van a mostrar del servicio de datos de referencia.
Confianza mínima: las sugerencias del servicio de datos de referencia con un nivel de confianza por debajo de este valor se omitirán. Escriba un valor en la notación decimal del valor de porcentaje correspondiente. Por ejemplo, escriba 0,6 para un porcentaje del 60 %.
Haga clic en Finalizar para publicar la base de conocimiento. Aparecerá un mensaje de confirmación una vez que la base de conocimiento se haya publicado correctamente.
Ahora puede utilizar esta base de conocimiento para la actividad de limpieza en un proyecto de calidad de datos con objeto de normalizar y limpiar direcciones de EE. UU. en los datos de origen de acuerdo con el conocimiento proporcionado por Melissa Data a través de Azure Marketplace.
Seguimiento: después de asignar un dominio a datos de referencia
Cree un proyecto de calidad de datos y ejecute la actividad de limpieza en los datos de origen que incluyan direcciones de EE. UU., comparándolos con la base de conocimiento creada en este tema. Consulte Limpiar datos mediante conocimiento (externo) de datos de referencia.