Traiga su propio Azure Data Lake Storage Gen2

Artículo
11/22/2024

Power Automate Process Mining le brinda la opción de almacenar y leer datos de registro de eventos directamente desde Azure Data Lake Storage Gen2. Esta función simplifica la administración de extracción, transformación y carga (ETL) al conectarse directamente a su cuenta de almacenamiento.

Requisitos previos

La cuenta de almacenamiento de Data Lake Storage debe ser Gen2. Puede comprobar esto desde el Azure Portal. Las cuentas de almacenamiento de Azure Data Lake de 1.ª generación no son compatibles.
La cuenta de Data Lake Storage debe tener un espacio de nombres jerárquico habilitado.
El rol de Propietario debe atribuirse al usuario que realiza la configuración inicial del contenedor para el entorno para los siguientes usuarios en el mismo entorno. Estos usuarios se conectan al mismo contenedor y deben tener estas asignaciones:
- Rol Lector de Datos de Storage Blob o Colaborador de datos de Storage Blob asignado
- Rol Lector de Azure Resource Manager asignado como mínimo.
La regla Intercambio de recursos (CORS)para su cuenta de almacenamiento debe estar configurada para compartir con Power Automate Process Mining.
- Los orígenes permitidos deben establecerse en https://make.powerautomate.com y https://make.powerapps.com.
- Los métodos permitidos deben incluir: get, options, put y post.
- Los encabezados permitidos deben ser lo más flexibles posible. Recomendamos definirlos como *.
- Los encabezados expuestos deben ser lo más flexibles posible. Recomendamos definirlos como *.
- La edad máxima debe ser lo más flexible posible. Recomendamos utilizar 86400.
Los datos en su Data Lake Storage deben cumplir con los siguientes requisitos de formato de archivo CSV:
- Tipo de compresión: Ninguna
- Delimitador de columna: Coma (,)
- Delimitador de fila: Predeterminado y codificación. Por ejemplo, Predeterminado (\r,\n o \r\n)
Todos los datos deben estar en formato de registro de eventos final y cumplir con los requisitos enumerados en Requisitos de datos. Los datos deben estar listos para ser mapeados al esquema de minería de procesos. No hay transformación de datos disponible después de la ingestión.
El tamaño (ancho) de la fila del encabezado está actualmente limitado a 1 MB.

Importante

Asegúrese de que la marca de tiempo representada en su archivo CSV siga el formato estándar ISO 8601 (por ejemplo, YYYY-MM-DD HH:MM:SS.sss o YYYY-MM-DDTHH:MM:SS.sss).

Conectar con Azure Data Lake Storage

En el panel de navegación de la izquierda, seleccione Process mining>Empezar aquí.
En el campo Nombre del proceso, escriba un nombre para el proceso.
Debajo del encabezado Origen de datos, seleccione Importar datos>Azure Data Lake>Continuar.
En la pantalla Configuración de la conexión, seleccione su Id. de suscripción, Grupo de recursos, Cuenta de almacenamiento, y Contenedor en los menús desplegables.
Seleccione el archivo o la carpeta que contiene los datos del registro de eventos.

Puede seleccionar un solo archivo o una carpeta con varios archivos. Todos los archivos deben tener los mismos encabezados y formato.
Seleccione Siguiente.
En la pantalla Asignar sus datos, asigne sus datos al esquema requerido.
Complete la conexión seleccionando Guardar y analizar.

Definir la configuración de actualización incremental de datos

Puede actualizar un proceso ingerido desde Azure Data Lake de forma programada, ya sea mediante una actualización completa o incremental. Aunque no hay políticas de retención, puede ingerir datos de forma incremental utilizando uno de los siguientes métodos:

Si seleccionó un fila única en la sección anterior, agregue más datos al archivo seleccionado.

Si seleccionó una carpeta en la sección anterior, agregue archivos incrementales a la carpeta seleccionada.

Importante

Cuando agregue archivos incrementales a una carpeta o subcarpeta seleccionada, asegúrese de indicar el orden de incremento nombrando archivos con fechas como AAAAMMDD.csv o AAAAMMDDHHMMSS.csv.

Para actualizar un proceso:

Ve a la página Detalles del proceso.
Seleccione Configuración de actualización.
Sobre la pantalla Programar actualización, complete los siguientes pasos:
1. Active la opción Mantenga los datos actualizados.
2. En las listas desplegalbes Actualizar datos cada, seleccione la frecuencia de la actualización.
3. En los campos Empieza a las, seleccione la fecha y la hora de la actualización.
4. Active la opción Actualización incremental.

Compartir a través de

Traiga su propio Azure Data Lake Storage Gen2

Requisitos previos

Conectar con Azure Data Lake Storage

Definir la configuración de actualización incremental de datos

Comentarios

Recursos adicionales