Detección, conexión y exploración de datos en Synapse mediante Microsoft Purview

Artículo
06/01/2023

En este documento, conocerá el tipo de interacciones que puede realizar al registrar una cuenta de Azure Purview en Synapse.

Requisitos previos

Uso de Microsoft Purview en Synapse

Para usar Microsoft Purview en Synapse, es necesario tener acceso a la cuenta de Microsoft Purview. Synapse pasa su permiso de Microsoft Purview. Como ejemplo, si tiene un rol de permiso de administrador provisional, podrá editar los metadatos que examina Microsoft Purview.

Detección de datos: conjuntos de datos de búsqueda

Para detectar los datos que Microsoft Purview ha registrado y examinado, puede usar la barra de búsqueda de la parte superior central del área de trabajo de Synapse. Asegúrese de seleccionar Microsoft Purview para buscar todos los datos de su organización.

Acciones de Microsoft Purview

Esta es una lista de las características de Azure Purview que están disponibles en Synapse:

Información general de los metadatos.
Vista y edición de esquemas de los metadatos con clasificaciones, términos de glosario, tipos de datos y descripciones.
Vista de linajes para comprender las dependencias y realizar análisis de los efectos. Para más información, consulte Linajes.
Vista y edición de contactos para saber quién es propietario o experto en un conjunto de datos.
Relacionadas para comprender las dependencias jerárquicas de un conjunto de datos concreto. Esta experiencia es útil para examinar la jerarquía de datos.
Haga clic en Solicitar acceso para solicitar acceso a los datos desencadenando el flujo de trabajo de acceso a datos de autoservicio configurado mediante un administrador de flujo de trabajo en Microsoft Purview. Para más información, consulte Solicitud de acceso y Flujos de trabajo de acceso de autoservicio para patrimonios de datos híbridos.

Acciones que puede realizar en los conjuntos de datos con recursos de Synapse

Conexión de los datos a Synapse

Puede crear un servicio vinculado a Synapse. Esa acción será necesaria para copiar datos en Synapse o tenerlos en el centro de datos (en el caso de orígenes de datos admitidos, como ADLSg2).
En el caso de objetos, como archivos, carpetas o tablas, puede crear directamente un conjunto de datos de integración y aprovechar un servicio vinculado existente, si ya se ha creado.

Todavía no se puede deducir si hay un servicio vinculado existente o un conjunto de datos de integración.

 Desarrollo en Synapse

Hay tres acciones que puede realizar: New SQL Script (Nuevo script de SQL), Nuevo cuaderno y New Data Flow (Nuevo flujo de datos).

Con New SQL Script (Nuevo script de SQL), en función del tipo de compatibilidad, puede hacer lo siguiente:

Ver las 100 primeras filas para comprender la forma de los datos.
Crear una tabla externa a partir de una base de datos de Synapse SQL.
Cargar los datos en una base de datos de Synapse SQL.

Con Nuevo cuaderno, puede hacer lo siguiente:

Cargar datos en una instancia de DataFrame de Spark.
Crear una tabla de Spark (si lo hace con el formato Parquet, también se crea una tabla de grupo de SQL sin servidor).

Con New data flow (Nuevo flujo de datos), puede crear un conjunto de datos de integración que se puede usar como origen en una canalización de flujo de datos. El flujo de datos es una funcionalidad de desarrollador sin código para realizar la transformación de datos. Más información sobre el uso de flujos de datos en Synapse.

Compartir a través de