Compartir vía


Preguntas frecuentes sobre Azure Data Catalog

Importante

Azure Data Catalog se retiró el 15 de mayo de 2024.

En el caso de las características de catálogo de datos, use el servicio Microsoft Purview, que ofrece una gobernanza de datos unificada para todo el patrimonio de datos.

En este artículo se responden algunas de las preguntas más frecuentes relativas al servicio Azure Data Catalog.

¿Qué es Azure Data Catalog?

Data Catalog es un servicio totalmente administrado, hospedado en Microsoft Azure, que actúa como sistema de registro y detección de orígenes de datos empresariales. Con él, todos los usuarios, desde analistas a científicos de datos o desarrolladores, pueden registrar, detectar, conocer y consumir orígenes de datos.

¿Qué problemas de los clientes soluciona?

Data Catalog soluciona los problemas de detección de orígenes de datos y "datos oscuros", con el fin de que los usuarios puedan detectar y conocer los orígenes de datos empresariales.

¿Cuáles son sus audiencias de destino?

Data Catalog está diseñado tanto para usuarios técnicos como para no técnicos, entre los que se incluyen:

  • Desarrolladores de datos y profesionales de BI y de análisis: responsables de generar datos y contenido de análisis para que otros lo consuman.
  • Administradores de datos: usuarios que tienen conocimientos de los datos, lo que significan y cómo están diseñados para usarse.
  • Consumidores de datos: aquellos que necesitan poder detectar, conocer y conectarse fácilmente a los datos necesarios para realizar su trabajo con la herramienta que prefieran.
  • TI central: usuarios que necesitan que los usuarios profesionales puedan detectar cientos de orígenes de datos y que necesitan tener siempre una visión general de cómo se usa los datos y quiénes lo hacen.

¿Cuánto tiempo está disponible Data Catalog?

Data Catalog está disponible hasta agosto de 2025. Tendrá que migrar en ese momento.

¿Adónde debemos migrar?

Puede migrar a servicio de Microsoft Purview que ofrece gobernanza de datos unificada para todo el patrimonio de datos.

¿Cuál es su disponibilidad por región?

Actualmente, los servicios de Data Catalog están disponibles en los siguientes centros de datos:

  • Oeste de EE. UU.
  • Este de EE. UU.
  • Oeste de Europa
  • Norte de Europa
  • Este de Australia
  • Sudeste de Asia

¿Cuáles son sus límites en cuanto al número de recursos de datos?

La edición gratuita de Data Catalog está limitada a 5.000 recursos de datos registrados.

La edición estándar de Data Catalog admite hasta 100 000 recursos de datos registrados.

Cualquier objeto registrado en Data Catalog, como tablas, vistas, archivos e informes, cuenta como recurso de datos.

¿Cuáles son los tipos de recursos y orígenes de datos que admite?

Para ver una lista de orígenes de datos admitidos actualmente, consulte los DSR de Data Catalog.

¿Cómo solicito soporte técnico para otro origen de datos?

Para enviar solicitudes de funciones y otros comentarios, vaya al foro de comentarios de Azure Data Catalog.

¿Por qué obtengo un error "El catálogo ya existe" cuando intento crear un nuevo catálogo?

Al comprar Office 365 E5 con licencia de Power BI Pro, Microsoft crea un catálogo predeterminado en la región de la suscripción automáticamente. Este catálogo usa la SKU gratuita. La licencia de Office 365 o Power BI se administra en la página de administración.

Sin embargo, este tipo de catálogo de datos no tiene una opción de administrador y no se puede ver en Azure Portal. No se puede eliminar este tipo de catálogo de datos. Del mismo modo, no se le permite cambiar el nombre del catálogo de datos y no puede trasladarlo a otra región.

Las cuentas de los usuarios que se asignan a una licencia de Power BI Pro automática tienen acceso al catálogo de datos debido al Contrato de licencia al registrarse en Office 365 E5 con la licencia de Power BI Pro. Este tipo de usuario tiene acceso total a los recursos del catálogo de datos sin privilegios administrativos. Este tipo de usuario no forma parte del rol de usuario de catálogo en Azure Data Catalog.

¿Cómo registro mis datos?

Para registrar datos Data Catalog:

  1. En el portal de Azure Data Catalog, en el área Publicar, inicie la herramienta de registro de Azure Data Catalog.
  2. En la herramienta de registro de orígenes de datos de Data Catalog, inicie sesión con las mismas credenciales que se usan para acceder al portal de Data Catalog.
  3. Seleccione el origen de datos y los recursos específicos que desea registrar.

¿Qué propiedades extrae de los recursos de datos que se registran?

Las propiedades específicas varían de un origen de datos a otro, pero en general, el servicio de publicación de Data Catalog extrae la siguiente información:

  • Nombre de activo
  • Tipo de recurso
  • Descripción de activos
  • Nombres de columna o atributo
  • Tipos de datos de columna o atributo
  • Descripción de la columna o atributo

Importante

Al registrar recursos de datos en Data Catalog, los datos no se mueven ni se copian a la nube. Al registrar recursos de un origen de datos, los metadatos de dichos recursos se copian en Azure, pero los datos permanecen en la ubicación del origen de datos existente. La excepción a esta regla es si se elige cargar registros de vista previa o un perfil de datos al registrar los recursos. Cuando se incluye una vista previa, se copian hasta 20 registros de cada recurso y se almacenan como una instantánea en Data Catalog. Al incluir un perfil de datos, se calcula la información de agregado y se incluye en los metadatos que se almacenan en el catálogo. La información de agregado puede incluir el tamaño de las tablas, el porcentaje de valores nulos por columna o los valores mínimos, máximos y medios de las columnas.

Nota:

En el caso de orígenes de datos como SQL Server Analysis Services que tienen una propiedad Description de primera clase, la herramienta de registro de orígenes de datos de Data Catalog extrae el valor de dicha propiedad. En el caso de las bases de datos relacionales de SQL Server locales que no tienen una propiedad Description de primera clase, la herramienta de registro de orígenes de datos de Data Catalog extrae el valor de la propiedad extendida MS_Description de los objetos y las columnas. Esta propiedad no se admite para SQL Azure. Para más información, consulte Usar propiedades extendidas en objetos de base de datos.

¿Cuánto tiempo se debe esperar para que los recursos recién registrados aparezcan en el catálogo?

Después de registrar recursos en Data Catalog, es posible que transcurra un período de entre 5 y 10 segundos hasta que aparezcan en el portal de Data Catalog.

¿Cómo se anotan y enriquecen los metadatos de mis recursos de datos registrados?

La forma más sencilla de proporcionar metadatos a los recursos registrados consiste en seleccionar el recurso en el portal de Data Catalog y, después, especificar los valores en el panel de propiedades o el panel de esquema del objeto seleccionado.

También puede proporcionar algunos metadatos, como etiquetas y expertos durante el proceso de registro. Los valores que se proporcionan en el servicio de publicación de Data Catalog se aplican a todos los recursos que se registran en ese momento. Para ver si los objetos registrados recientemente en el portal tienen anotaciones adicionales, seleccione el botón Ver portal en la pantalla final de la herramienta de registro de orígenes de datos de Data Catalog.

¿Cómo elimino los objetos de datos registrados?

Para eliminar un objeto de Data Catalog selecciónelo en el portal y haga clic en el botón Eliminar. Al eliminar el objeto se quitan sus metadatos de Data Catalog, pero esto no afecta al origen de datos subyacente.

¿Qué es un experto?

Un experto es una persona que tiene una perspectiva informada acerca de un objeto de datos. Un objeto puede tener varios expertos. No es necesario que un experto sea el "propietario" de un objeto, puede ser simplemente alguien que sepa cómo se pueden (y deben) utilizar los datos.

¿Cómo comparto información con el equipo de Data Catalog si surge algún problema?

Para notificar cualquier problema, compartir información y formular preguntas, vaya al foro de preguntas y respuestas de Azure Data Catalog o abra una solicitud de soporte técnico.

¿Funciona el catálogo con otro origen de datos que me interesa?

Trabajamos activamente para agregar más orígenes de datos a Data Catalog. Si desea que un origen de datos concreto sea compatible, sugiéralo (o indique que está de acuerdo con esta sugerencia si ya se ha planteado) en el foro de comentarios de Azure Data Catalog.

¿Qué permisos necesito para registrar recursos en Data Catalog?

Para ejecutar la herramienta de registro de Data Catalog necesita permisos en el origen de datos que le permitan leer los metadatos de este. Para incluir también una vista previa, debe tener permisos para leer en los datos desde los objetos que se están registrando.

Data Catalog también permite a los administradores de catálogo restringir qué usuarios y grupos pueden añadir metadatos al catálogo. Para más información, consulte Acceso seguro al catálogo de datos y a los activos de datos.

¿Estará Data Catalog disponible también para las implementaciones locales?

Data Catalog es un servicio en la nube que puede funcionar con orígenes de datos tanto locales como en la nube para ofrecer una solución híbrida de detección de orígenes de datos. Actualmente no está prevista la creación de una versión del servicio Data Catalog que se ejecute de forma local.

¿Se pueden extraer más metadatos, o metadatos más ricos, de los orígenes de datos que se registran?

Trabajamos activamente para ampliar las funcionalidades de Data Catalog. Si desea que se extraigan más metadatos del origen de datos durante el registro, sugiéralo (o vote por ello si ya se ha planteado) en el foro de comentarios de Azure Data Catalog.

Si desea incluir metadatos de columna o esquema, vistas previas o perfiles de datos para orígenes de datos en los que no se extraen estos metadatos mediante la herramienta de registro de orígenes de datos, puede usar la API de Data Catalog para añadir estos metadatos. Para más información, consulte la API REST de Azure Data Catalog.

¿Cómo se restringe la visibilidad de los recursos de datos registrados para que solo determinadas personas puedan detectarlos?

Seleccione los recursos de datos en Data Catalog y seleccione el botón Tomar posesión. Los propietarios de los recursos de datos de Data Catalog pueden cambiar la configuración de visibilidad para permitir que todos los usuarios detecten los recursos que se poseen o restringir la visibilidad a determinados usuarios. Para más información, consulte Administración de recursos de datos en Azure Data Catalog.

¿Cómo se actualiza el registro de un recurso de datos para que los cambios del origen de datos se reflejen en el catálogo?

Para actualizar los metadatos de los recursos de datos que ya están registrados en el catálogo, solo hay que volver a registrar el origen de datos que contiene los recursos. Los cambios que se produzcan en el origen de datos, como la incorporación o eliminación de columnas de tablas o vistas, se actualizan en el catálogo, pero se mantienen las anotaciones que han realizado los usuarios.

No encuentro ninguna respuesta a mi pregunta. ¿Dónde puedo encontrarla?