Importar dominios desde un archivo de Excel a la detección de conocimientos: Data Quality Services (DQS)
Se aplica a: SQL Server
En este tema se describe cómo importar uno o varios dominios desde un archivo de Excel a la actividad de detección de conocimiento de Data Quality Services (DQS). El proceso de importación simplifica el proceso de generación del conocimiento, lo que permite ahorrar tiempo y esfuerzo. Permite a los usuarios que disponen de datos en un archivo de Excel o un archivo de texto crear una base de conocimiento con dichos datos. (Consulte Importar valores desde un archivo de Excel a un dominio para obtener más información sobre cómo importar valores a un dominio de una base de conocimiento existente). No se admite la exportación a un archivo de Excel.
Antes de empezar
Requisitos previos
Para importar dominios desde un archivo de Excel, es necesario tener instalado Excel en el ordenador en el que está instalado Data Quality Client; también se debe haber creado un archivo de Excel con valores de dominio (consulte How the import works); así como haber creado y abierto una base de conocimiento en la que importar el dominio.
Seguridad
Permisos
Debe disponer del rol dqs_kb_editor o dqs_administrator en la base de datos DQS_MAIN para poder importar dominios desde un archivo de Excel.
Importar dominios desde un archivo de Excel a una base de conocimiento
Inicie el cliente de calidad de datos. Para obtener información sobre cómo hacerlo, consulte Ejecución de la aplicación Data Quality Client.
En la pantalla principal de Data Quality Client, siga uno de estos procedimientos:
Cree una nueva base de conocimiento en la que realizar la importación; para ello, haga clic en Nueva base de conocimiento, escriba un nombre para la base de conocimiento, seleccione Ninguno para Crear base de conocimiento a partir de, seleccione la actividad Detección de conocimiento y, a continuación, haga clic en Crear.
Abra una base de conocimiento existente en la que realizar la importación; para ello, haga clic en Abrir base de conocimiento, seleccione la base de conocimiento, seleccione Detección de conocimientoy, a continuación, haga clic en Siguiente.
En la página Asignación , seleccione Archivo de Excel en Origen de datos.
Haga clic en Examinar en la línea Archivo de Excel .
En el cuadro de diálogo Seleccione un archivo de Excel , desplácese a la carpeta que contiene el archivo de Excel desde el que desea realizar la importación, seleccione dicho archivo y, a continuación, haga clic en Abrir.
En la lista desplegable Hoja de cálculo , seleccione la hoja de cálculo del archivo de Excel desde la que desea realizar la importación.
Seleccione Usar la primera fila como encabezado si desea que la primera fila se considere como un encabezado de datos, y si desea que los valores de la primera fila se utilicen como nombres de columna. Anule la selección de Usar la primera fila como encabezado si desea que la primera fila se considere como un valor de datos, en cuyo caso DQS utilizará los nombres del encabezado de Excel (letras en orden alfabético) para las columnas.
Seleccione una columna y asígnela un dominio existente, o bien cree un nuevo dominio haciendo clic en el icono Crear un dominio , utilice el cuadro de diálogo Crear un dominio para crearlo y, a continuación, asígnelo a la columna. El tipo de datos del dominio debe coincidir con el tipo de datos de la columna. Repita el proceso para todas las columnas de la hoja de cálculo.
Haga clic en Next.
En la página Detectar , haga clic en Iniciar para analizar los datos de la hoja de cálculo de Excel.
Nota:
Si abandona la página antes de que se hayan cargado los datos, el proceso de carga de archivos terminará.
Compruebe que el análisis se ha realizado correctamente y, a continuación, haga clic en Siguiente.
En la página Administrar valores del dominio , compruebe que aparecen los dominios correctos en la lista Dominios y que la tabla de dominios contiene valores.
Haga clic en Finalizary, a continuación, haga clic en Publicar para publicar la base de conocimiento, o en No para no publicarla.
Compruebe que la base de conocimiento se ha publicado y haga clic en Aceptar.
Seguimiento: después de importar dominios desde un archivo de Excel
Después de importar dominios desde un archivo de Excel, puede agregar conocimiento a dichos dominios o utilizarlos en un proyecto de limpieza o de búsqueda de coincidencias, en función del contenido de los dominios. Para más información, vea Realizar la detección de conocimiento, Administrar un dominio, Administrar un dominio compuesto, Crear una directiva de coincidencia, Limpieza de datos o Coincidencia de datos.
How the import works
En la operación de importación, DQS interpreta un archivo de Excel de la manera siguiente:
Una columna representa un dominio
Una fila representa un registro de datos
La primera fila puede representar los nombres de dominio o el primer valor o registro de datos, dependiendo del valor de la casilla Usar la primera fila como encabezado .
Se aplican las reglas siguientes a la operación de importación:
Esta operación importa valores de dominio en una base de conocimiento. No importa reglas de dominio ni directivas de coincidencia.
El archivo de Excel puede tener la extensión .xlsx, .xls o .csv. Es necesario tener instalado Microsoft Excel en el ordenador de Data Quality Client para poder importar valores de dominio o un dominio completo. Se admiten las versiones 2003 y posteriores de Excel. Si se utiliza la versión de 64 bits de Excel, solo se admitirán los archivos de Excel 2003; los archivos de Excel 2007 o 2010 no son compatibles.
Los archivos de Excel de tipo .xlsx no se admiten en una instalación de 64 bits de Excel. Si utiliza Excel de 64 bits, guarde el archivo de hoja de cálculo como un archivo .xls.
En los archivos .xlsx y .xls, el tipo de datos de la columna está determinado por el tipo de datos más frecuente de las ocho primeras filas. Si una celda no se ajusta a dicho tipo de datos, se le asignará un valor NULL.
En los archivos .csv, el tipo de datos está determinado por el tipo de datos más frecuente de las ocho primeras filas.
Los valores de una hoja de cálculo de Excel que no se ajusten a una regla de dominio se importarán como valores no válidos.
Si el archivo de Excel no tiene el formato correcto o está dañado, la operación de importación generará un error.