Conexión a Azure Data Lake Storage Gen2 para el almacenamiento del flujo de datos
Puede configurar flujos de datos para almacenar sus datos en la cuenta de Azure Data Lake Storage Gen2 de su organización. En este artículo se describen los pasos generales necesarios para hacerlo y se proporcionan instrucciones y procedimientos recomendados a lo largo del proceso.
Importante
La característica Flujo de datos con tablas analíticas utiliza el servicio Azure Synapse Link for Dataverse, que puede ofrecer distintos niveles de cumplimiento, privacidad, seguridad y compromisos de ubicación de datos. Para obtener más información sobre Azure Synapse Link for Dataverse, vaya a ¿Qué es Azure Synapse Link for Dataverse?.
Configurar los flujos de datos para que almacenen sus definiciones y archivos de datos en el lago de datos tiene algunas ventajas, por ejemplo:
- Azure Data Lake Storage Gen2 proporciona una instalación de almacenamiento de datos enormemente escalable.
- Los desarrolladores del departamento de TI pueden aprovechar los archivos de datos y definiciones de flujo de datos para aprovechar los servicios de inteligencia artificial (IA) de Azure, como se muestra en los ejemplos de GitHub de los servicios de datos de Azure.
- Permite a los desarrolladores de su organización integrar datos de flujo de datos en aplicaciones internas y soluciones de línea de negocio, mediante recursos para desarrolladores para flujos de datos y Azure.
Requisitos
Para usar Azure Data Lake Storage Gen2 para flujos de datos, necesita lo siguiente:
- Un entorno de prueba de Power Apps. Cualquier plan de Power Apps le permitirá crear flujos de datos con Azure Data Lake Storage Gen2 como destino. Deberá estar autorizado en el entorno como creador.
- Suscripción a Azure. Necesita una suscripción de Azure para usar Azure Data Lake Storage Gen2.
- Un grupo de recursos. Utilice un grupo de recursos que ya tenga o cree uno nuevo.
- Una cuenta de almacenamiento de Azure. La cuenta de almacenamiento debe tener la característica de Data Lake Storage Gen2 habilitada.
Sugerencia
Si no tiene una suscripción a Azure, cree una cuenta de prueba gratuita antes de empezar.
Preparación de los flujos de datos de Azure Data Lake Storage Gen2 para Power Platform
Antes de configurar el entorno con una cuenta de Azure Data Lake Storage Gen2, debe crear y configurar una cuenta de almacenamiento. Estos son los requisitos para los flujos de datos de Power Platform:
- La cuenta de almacenamiento debe crearse en el mismo inquilino de Microsoft Entra ID que el inquilino de Power Apps.
- Se recomienda crear la cuenta de almacenamiento en la misma región que el entorno de Power Apps en el que planea usarlo. Para determinar dónde está el entorno de Power Apps, póngase en contacto con el administrador del entorno.
- La cuenta de almacenamiento debe tener habilitada la característica de espacio de nombres jerárquico.
- Debe tener un rol propietario en la cuenta de almacenamiento.
En las secciones siguientes se describen los pasos necesarios para configurar la cuenta de Azure Data Lake Storage Gen2.
Creación de la cuenta de almacenamiento
Siga los pasos descritos en Creación de una cuenta de almacenamiento de Azure Data Lake Storage Gen2.
- Asegúrese de seleccionar la misma región que el entorno y de establecer el almacenamiento como StorageV2 (uso general v2).
- Asegúrese de habilitar la característica de espacio de nombres jerárquico.
- Se recomienda establecer la configuración de replicación como almacenamiento con redundancia geográfica de acceso de lectura (RA-GRS).
Conexión de Azure Data Lake Storage Gen2 a Power Apps
Una vez que haya configurado la cuenta de Azure Data Lake Storage Gen2 en Azure Portal, estará listo para conectarse a un flujo de datos específico o a un entorno de Power Apps. La conexión del lago a un entorno permite a otros creadores y administradores del entorno crear flujos de datos que almacenen también sus datos en el lago de la organización.
Para conectar la cuenta de Azure Data Lake Storage Gen2 con el flujo de datos, siga estos pasos:
Inicie sesión en Power Apps y compruebe en qué entorno está. El conmutador de entorno se encuentra en el lado derecho del encabezado.
En el panel de navegación izquierdo, seleccione la flecha hacia abajo situada junto a Datos.
En la lista que aparece, seleccione Flujos de datos y, a continuación, en la barra de comandos, seleccione Nuevo flujo de datos.
Seleccione las tablas analíticas que desee. Estas tablas indican qué datos desea almacenar en la cuenta de Azure Data Lake Store Gen2 de la organización.
Selección de la cuenta de almacenamiento que se va a usar para el almacenamiento de flujo de datos
Si aún no se ha asociado una cuenta de almacenamiento con el entorno, aparece el cuadro de diálogo Nuevo enlace al lago de datos. Deberá iniciar sesión y buscar el lago de datos que creó en los pasos anteriores. En este ejemplo, no hay ningún lago de datos asociado al entorno y, por tanto, se genera una solicitud para agregar uno.
Seleccione la cuenta de almacenamiento.
Aparecerá la pantalla Seleccionar cuenta de almacenamiento.
Seleccione el Id. de suscripción de la cuenta de almacenamiento.
Seleccione el Nombre del grupo de recursos en el que se creó la cuenta de almacenamiento.
Escriba el nombre de la cuenta de almacenamiento.
Seleccione Guardar.
Una vez completados correctamente estos pasos, la cuenta de Azure Data Lake Storage Gen2 está conectada a flujos de datos de Power Platform y puede seguir creando un flujo de datos.
Consideraciones y limitaciones
Hay algunas consideraciones y limitaciones a tener en cuenta al trabajar con el almacenamiento de flujo de datos:
- No se admite la vinculación de una cuenta de Azure Data Lake Store Gen2 para el almacenamiento de flujo de datos en el entorno predeterminado.
- Una vez configurada una ubicación de almacenamiento de flujo de datos para un flujo de datos, no se puede cambiar.
- Una vez vinculada una cuenta de almacenamiento, no se admite el cambio del nombre del entorno y se producirá un error en los flujos de datos vinculados a esa cuenta de almacenamiento. Al volver a cambiar el nombre del entorno, se volverán a habilitar esos flujos de datos.
- De forma predeterminada, cualquier miembro del entorno puede acceder a los datos del flujo de datos mediante el conector de flujos de datos de Power Platform. Sin embargo, solo los propietarios de un flujo de datos pueden acceder a sus archivos directamente en Azure Data Lake Storage Gen2. Para autorizar a más personas a acceder a los datos de flujos de datos directamente en el lago, debe autorizarlos a la Carpeta CDM del flujo de datos en el lago de datos o en el propio lago de datos.
- Cuando se elimina un flujo de datos, también se eliminará su Carpeta CDM en el lago.
- No se admite el intento de conectar dos tablas de flujo de datos entre dos áreas de trabajo de distintos tipos de almacenamiento (Bring Your Own Storage Account (BYOSA) e interno.
Importante
No debe cambiar los archivos creados por flujos de datos en el lago de la organización ni agregar archivos a la Carpeta CDM de un flujo de datos. El cambio de archivos puede dañar los flujos de datos o modificar su comportamiento y no se admite. Los flujos de datos de Power Platform solo conceden acceso de lectura a los archivos que crea en el lago. Si autoriza a otras personas o servicios al sistema de archivos usado por los flujos de datos de Power Platform, concédales acceso de lectura a archivos o carpetas de ese sistema de archivos.
Aviso de privacidad
Al habilitar la creación de flujos de datos con tablas analíticas en su organización, a través del servicio Azure Synapse Link for Dataverse, los detalles sobre la cuenta de almacenamiento de Azure Data Lake, como el nombre de la cuenta de almacenamiento, se enviarán y almacenarán en el servicio Azure Synapse Link for Dataverse, que actualmente se encuentra fuera del límite de cumplimiento de PowerApps y puede emplear medidas de privacidad y seguridad menores o diferentes a las habituales en PowerApps. Tenga en cuenta que puede eliminar la asociación al lago de datos en cualquier momento para dejar de utilizar esta funcionalidad y los detalles de la cuenta de almacenamiento de Azure Data Lake se eliminarán del servicio Azure Synapse Link for Dataverse. Encontrará más información sobre Azure Synapse Link for Dataverse en este artículo.
Preguntas más frecuentes
¿Qué ocurre si he creado previamente flujos de datos en Azure Data Lake Storage Gen2 de mi organización y quiero cambiar su ubicación de almacenamiento?
No puede cambiar la ubicación de almacenamiento de un flujo de datos después de crearlo.
¿Cuándo puedo cambiar la ubicación de almacenamiento de flujo de datos de un entorno?
Actualmente no se admite el cambio de la ubicación de almacenamiento del flujo de datos del entorno.
Pasos siguientes
En este artículo se proporcionan instrucciones sobre cómo conectar una cuenta de Azure Data Lake Storage Gen2 para el almacenamiento de flujo de datos.
Para más información sobre los flujos de datos, Common Data Model y Azure Data Lake Storage Gen2, consulte estos artículos:
- Preparación de los datos de autoservicio con flujos de datos
- Creación y uso de flujos de datos en Power Apps
- Agregar datos a una tabla en Microsoft Dataverse
Para obtener más información acerca del almacenamiento de Azure, consulte este artículo:
Para obtener más información sobre Common Data Model, consulte estos artículos:
- Common Data Model - visión general
- Carpetas de Common Data Model
- Definición de archivo del modelo de CDM
Puede formular preguntas en la Comunidad de Power Apps.