Compartir a través de


Migración de Dataflow Gen1 a Dataflow Gen2

Este artículo tiene como destino creadores de flujos de datos de Power BI. Proporciona instrucciones y justificaciones para ayudar a migrar sus flujos de datos a Dataflow Gen2 en Data Factory para Microsoft Fabric.

Nota

Dataflow Gen2 es una nueva generación de flujos de datos que ofrece nuevas características y experiencias mejoradas. Los flujos de datos de Gen2 residen junto con los flujos de datos de Power BI, que ahora se conocen como Dataflow Gen1.

Para comprender las diferencias entre Dataflow Gen1 y Dataflow Gen2, consulte Getting from Dataflow Generation 1 to Dataflow Generation 2.

Fondo

Microsoft Fabric ha evolucionado en una plataforma integrada tanto para autoservicio como para los datos empresariales gestionados por TI. Con el crecimiento exponencial de los volúmenes de datos y la complejidad, los clientes de Fabric exigen que sus soluciones empresariales se escalen de forma segura, fácil de administrar y accesibles para todos los usuarios de la mayor parte de las organizaciones.

En los últimos años, Microsoft ha dado grandes pasos para ofrecer capacidades escalables en la nube para la capacidad de Fabric . Para ello, Data Factory en Fabric empodera instantáneamente a un amplio ecosistema de desarrolladores y soluciones de integración de datos que se han creado durante décadas. Aprovecha el conjunto completo de características y funcionalidades que van mucho más allá de la funcionalidad comparable disponible en generaciones anteriores.

Naturalmente, los clientes ahora preguntan si hay una oportunidad para consolidar sus soluciones de integración de datos al hospedarlas en Fabric. A menudo hacen preguntas como:

  • ¿Toda la funcionalidad del flujo de datos de la que dependemos funciona en Dataflow Gen2?
  • ¿Qué funcionalidades solo están disponibles en Dataflow Gen2?
  • ¿Cómo se migran los flujos de datos existentes a Dataflow Gen2?
  • ¿Cuál es la hoja de ruta de Microsoft para la ingesta de datos empresariales?

En este artículo se describen respuestas a muchas de estas preguntas.

Nota

La decisión de migrar a la capacidad de Fabric depende de los requisitos de cada cliente. Los clientes deben evaluar cuidadosamente las ventajas para tomar una decisión informada. Esperamos ver la migración orgánica a Dataflow Gen2 a lo largo del tiempo, y nuestra intención es que se produzca en términos con los que el cliente se sienta cómodo.

Para estar claro, actualmente no hay ningún plan para dejar de usar flujos de datos de Power BI o flujos de datos de Power Platform. Sin embargo, hay una prioridad para centrar la inversión en Dataflow Gen2 para la ingesta de datos empresariales, por lo que el valor proporcionado por la capacidad de Fabric aumentará con el tiempo. Los clientes que elijan la capacidad de Microsoft Fabric pueden esperar beneficiarse de la alineación con la hoja de ruta del producto de Microsoft Fabric.

Convergencia de la integración de datos empresariales y de autoservicio

La consolidación de elementos en Fabric simplifica el descubrimiento, la colaboración y la administración mediante la colocación conjunta de recursos. Permite a los equipos de TI centrales adoptar e integrar más fácilmente elementos populares de autoservicio. Al mismo tiempo, permite poner en funcionamiento los servicios de transformación y movimiento de datos críticos alineados con estándares corporativos, incluido el linaje y la supervisión de datos.

Para admitir las necesidades colaborativas y escalables de los creadores, Dataflow Gen2 en Fabric presenta copia rápida, lo que permite una ingesta eficaz de grandes volúmenes de datos mediante el uso de la infraestructura de back-end de Fabric para almacenar y procesar datos intermedios durante la transformación. Puede controlar terabytes de datos sin problemas. Los creadores de flujos de datos pueden especificar destinos de datos para sus datos transformados, como fabric lakehouse, warehouse, eventhouse o Azure SQL Database, lo que facilita una mejor administración y accesibilidad de los datos. Además, la reciente integración de ia generativa a través de Copilot mejora la experiencia de preparación de datos al proporcionar generación inteligente de código y automatizar tareas repetitivas, lo que proporciona una ruta más sencilla y rápida para crear soluciones complejas.

Mediante el uso de una plataforma común, el flujo de trabajo se simplifica, lo que da como resultado una colaboración mejorada entre la empresa y TI. Por lo tanto, las organizaciones están facultadas para escalar sus soluciones de datos a niveles empresariales, lo que garantiza un alto rendimiento, flexibilidad y eficiencia en la administración de grandes volúmenes de datos.

Capacidad de tejido

Gracias a su arquitectura distribuida, la capacidad de Fabric es menos sensible a la carga general, picos de carga temporales y alta concurrencia. Al consolidar las capacidades en SKU de capacidad de Fabric más grandes, los clientes pueden lograr un mayor rendimiento y una mayor capacidad de procesamiento.

Comparación de características

En la tabla siguiente se presentan características compatibles con el flujo de datos de Power BI o Fabric Dataflow Gen2.

Característica Flujo de datos de Power BI Gen1 Fabric Dataflow Gen2
Conectividad
Compatibilidad con todos los orígenes de datos de Power Query
Conexión y carga de datos desde flujos de datos en Power BI Desktop, Excel o Power Apps
Escalabilidad
copia rápida, que admite la ingesta de datos a gran escala, utilizando la canalización de datos actividad de copia dentro de flujos de datos No
actualización programada, que mantiene los datos actualizados
actualización incremental, que utiliza directivas para automatizar la carga incremental de datos y puede facilitar la generación de informes casi en tiempo real.
orquestación de canalización de datos, que permite agregar una actividad de flujo de datos a una canalización de datos y crear eventos condicionales orquestados No
inteligencia artificial
Copilot para Data Factory, que proporciona generación inteligente de código para transformar datos con facilidad y genera explicaciones de código para ayudar a comprender mejor las tareas complejas. No
Cognitive Services, que usan inteligencia artificial (AI) para aplicar algoritmos diferentes de Azure Cognitive Services para enriquecer la preparación de datos de autoservicio No 1
aprendizaje automático automatizado (AutoML), que permite a los analistas de negocios entrenar, validar e invocar modelos de aprendizaje automático (ML) directamente en Fabric En desuso 2
Integración de Azure Machine Learning, que expone modelos personalizados como funciones dinámicas de Power Query que los usuarios pueden invocar en el Editor de Power Query No 1
Gestión de contenido
vista de linaje de datos, que ayuda a los usuarios a comprender y evaluar las dependencias de los elementos del flujo de datos
canalizaciones de implementación, que administran el ciclo de vida del contenido de Fabric
escalabilidad y resistencia de la plataforma
Arquitectura Premium de capacidad, que admite un mayor escalado y rendimiento
compatibilidad multigeográfica, que ayuda a los clientes multinacionales a abordar los requisitos de residencia de datos regionales, sectoriales u organizativos. 3
Seguridad
puerta de enlace de datos de red virtual (VNet) conectividad, lo que permite que Fabric funcione sin problemas en la red virtual de una organización. No
conectividad de puerta de enlace de datos local, lo que permite el acceso seguro de los datos entre los orígenes de datos locales de una organización y Fabric.
La compatibilidad con las etiquetas de servicio de Azure , que es un grupo definido de direcciones IP que se gestionan automáticamente para minimizar la complejidad de las actualizaciones o los cambios en las reglas de seguridad de red.
Gobernanza
Contenido aprobación, para promover o certificar artículos valiosos y de alta calidad de tejido.
integración de Microsoft Purview, que ayuda a los clientes a administrar y controlar los elementos de Fabric
Microsoft Information Protection (MIP) etiquetas de confidencialidad e integración con Microsoft Defender for Cloud Apps para la prevención de pérdida de datos (DLP)
Registro de supervisión y diagnóstico
Se ha mejorado historial de actualizaciones, lo que le permite evaluar en detalle lo que ha ocurrido durante la actualización del flujo de datos. No
nodo de supervisión, que proporciona capacidades de supervisión para elementos de Fabric No
aplicación de Métricas de Capacidad de Microsoft Fabric, que proporciona capacidades de monitorización para la capacidad de Fabric
registro de auditoría, que realiza un seguimiento de las actividades del usuario en Fabric y Microsoft 365

1 Para aprender a crear funciones personalizadas que llaman a puntos de conexión de api de Azure AI, consulte Tutorial: Extracción de frases clave del texto almacenado en Power BI.

2 Machine Learning automatizado (AutoML) ha quedado en desuso. Para obtener más información, consulte este anuncio oficial.

3 Para configurar el almacenamiento de flujo de datos de Power BI para usar Azure Data Lake Storage (ADLS) Gen2, consulte este artículo.

Consideraciones

Hay otras consideraciones que se deben tener en cuenta en el planeamiento antes de migrar a Dataflow Gen2.

Licenciamiento

Necesita una licencia Pro o Premium por usuario (PPU) para publicar o administrar flujos de datos de Power BI (Dataflow Gen1). Por el contrario, solo necesita una licencia de Microsoft Fabric (gratis) para crear un flujo de datos Gen2 en un área de trabajo de capacidad Premium.

Migración

Las plantillas de Power Query simplifican el proceso de transferencia de un proyecto entre distintas integraciones de Power Query. Ayudan a simplificar lo que podría ser una tarea compleja y con mucho tiempo. Las plantillas encapsulan todo el proyecto de Power Query, incluidos los scripts y los metadatos, en un único archivo portátil.

Las plantillas de Power Query se han diseñado para ser compatibles con diversas integraciones, como flujos de datos de Power BI y Fabric Dataflow Gen2, lo que garantiza una transición sin problemas entre estos servicios.

Hoja de ruta

El plan de lanzamiento Microsoft Fabric anuncia las actualizaciones y plazos más recientes a medida que las características se preparan para próximas versiones, incluidas lo nuevo y lo planeado para Data Factory en Microsoft Fabric.

Para obtener más información sobre este artículo, consulte los siguientes recursos: