Migrer de Dataflow Gen1 vers Dataflow Gen2
Cet article cible les créateurs de flux de données Power BI. Il leur fournit des conseils et des raisons pour aider à migrer leurs flux de données vers Dataflow Gen2 dans Data Factory pour Microsoft Fabric.
Remarque
Dataflow Gen2 est une nouvelle génération de flux de données qui offre de nouvelles fonctionnalités et des expériences améliorées. Les flux de données Gen2 résident en même temps que les flux de données Power BI, qui sont désormais appelés Dataflow Gen1.
Pour comprendre les différences entre Dataflow Gen1 et Dataflow Gen2, consultez Passer de Dataflow Génération 1 à Dataflow Génération 2.
Arrière-plan
Microsoft Fabric a évolué en une plateforme intégrée pour les données d’entreprise en libre-service et gérées par l’informatique. Avec une croissance exponentielle des volumes de données et de la complexité, les clients Fabric demandent que leurs solutions d’entreprise soient mises à l’échelle, sécurisées, faciles à gérer et accessibles à tous les utilisateurs au sein des plus grandes organisations.
Ces dernières années, Microsoft a fait de grands progrès pour offrir des capacités cloud évolutives à la capacité Fabric de . À cette fin, Data Factory dans Fabric permet instantanément un vaste écosystème de développeurs d’intégration de données et de solutions d’intégration de données qui ont été créées au fil des décennies. Il tire parti de l’ensemble complet de fonctionnalités et de fonctionnalités qui vont bien au-delà des fonctionnalités comparables disponibles dans les générations précédentes.
Naturellement, les clients demandent maintenant s’il existe une opportunité de consolider leurs solutions d’intégration de données en les hébergeant dans Fabric. Ils posent souvent des questions telles que :
- Toutes les fonctionnalités de flux de données dont nous dépendons fonctionnent-elles dans Dataflow Gen2 ?
- Quelles sont les fonctionnalités disponibles uniquement dans Dataflow Gen2 ?
- Comment migrer des flux de données existants vers Dataflow Gen2 ?
- Quelle est la feuille de route de Microsoft pour l’ingestion des données d’entreprise ?
Les réponses à la plupart de ces questions sont décrites dans cet article.
Remarque
La décision de migrer vers la capacité Fabric dépend des exigences de chaque client. Les clients doivent évaluer soigneusement les avantages pour prendre une décision éclairée. Nous nous attendons à voir la migration organique vers Dataflow Gen2 au fil du temps, et notre intention est qu’il se produit sur les conditions que le client est à l’aise avec.
Pour être clair, il n'y a actuellement aucun projet d'abandon des dataflows Power BI ou des dataflows Power Platform. Toutefois, il existe une priorité pour concentrer l’investissement sur Dataflow Gen2 pour l’ingestion de données d’entreprise, et ainsi la valeur fournie par la capacité Fabric augmentera au fil du temps. Les clients qui choisissent la capacité Fabric peuvent prévoir de bénéficier de l'alignement avec la feuille de route du produit Microsoft Fabric .
Convergence de l’intégration des données en libre-service et d’entreprise
La consolidation des éléments dans Fabric simplifie la découverte, la collaboration et la gestion en colocalisant des ressources. Il permet aux équipes informatiques centrales d’adopter et d’intégrer plus facilement des éléments en libre-service populaires. En même temps, elle permet d’opérationnaliser les services de déplacement et de transformation des données stratégiques alignés sur les normes de l’entreprise, notamment la traçabilité et la surveillance des données.
Pour prendre en charge les besoins collaboratifs et évolutifs des créateurs, Dataflow Gen2 dans Fabric introduit copie rapide, ce qui permet une ingestion efficace de volumes de données volumineux à l’aide de l’infrastructure principale de Fabric pour stocker et traiter données intermédiaires pendant la transformation. Il peut gérer en toute transparence les téraoctets de données. Les créateurs de flux de données peuvent spécifier les destinations de données pour leurs données transformées, telles qu’une structure lakehouse, un entrepôt, un entrepôt d’événements ou Azure SQL Database, facilitant ainsi une meilleure gestion et accessibilité des données. Et plus encore, l’intégration récente de l’IA générative par le biais de Copilot améliore l’expérience de préparation des données en fournissant une génération de code intelligente et en automatisant les tâches répétitives, offrant un chemin plus facile et plus rapide pour créer des solutions complexes.
En utilisant une plateforme commune, le flux de travail est rationalisé, ce qui entraîne une collaboration améliorée entre l’entreprise et l’informatique. Les organisations sont donc autorisées à mettre à l’échelle leurs solutions de données aux niveaux de l’entreprise, en garantissant de hautes performances, une flexibilité et une efficacité élevées dans la gestion de grands volumes de données.
Capacité du réseau
Grâce à son architecture distribuée, la capacité du tissu est moins sensible à la charge globale, aux pics temporels et à la forte concurrence. En regroupant les capacités vers des modèles SKU de plus grande capacité de Fabric, les clients peuvent obtenir des performances et un débit accrus.
Comparaison des fonctionnalités
Le tableau suivant présente les fonctionnalités prises en charge dans le flux de données Power BI et/ou Fabric Dataflow Gen2.
Fonctionnalité | Power BI Dataflow Gen1 | Flux de données Fabric Gen2 |
---|---|---|
Connectivité | ||
Prise en charge de toutes les sources de données Power Query | Oui | Oui |
Se connecter et charger des données à partir des flux de données dans Power BI Desktop, Excel ou Power Apps | Oui | Oui |
Extensibilité | ||
Copie rapide, qui prend en charge l’ingestion de données à grande échelle, en utilisant l’activité de copie du pipeline de données dans les flux de données | Non | Oui |
Actualisation planifiée, qui maintient les données à jour | Oui | Oui |
Rafraîchissement incrémentiel, qui utilise des stratégies pour automatiser le chargement des données incrémentielles et peut aider à fournir des rapports en temps quasi réel | Oui | Oui |
Orchestration de pipeline de données, ce qui vous permet d’ajouter une activité de flux de données à un pipeline de données et de créer des événements conditionnels orchestrés | Non | Oui |
intelligence artificielle | ||
Copilot pour Data Factory, qui fournit une génération de code intelligente pour transformer les données avec facilité et génère des explications de code pour mieux comprendre les tâches complexes | Non | Oui |
Cognitive Services, qui utilisent l’intelligence artificielle (IA) pour appliquer différents algorithmes d’Azure Cognitive Services pour enrichir la préparation des données en libre-service | Oui | Non 1 |
AutoML (Automated Machine Learning), qui permet aux analystes métier de former, valider et appeler des modèles Machine Learning (ML) directement dans Fabric | Déconseillé 2 | |
intégration Azure Machine Learning, qui expose des modèles personnalisés en tant que fonctions Power Query dynamiques que les utilisateurs peuvent appeler dans l’éditeur Power Query | Oui | Non 1 |
Gestion du contenu | ||
Vue de traçabilité des données, qui aident les utilisateurs à comprendre et à évaluer les dépendances d’éléments de flux de données | Oui | Oui |
Pipelines de déploiement, qui gèrent le cycle de vie du contenu Fabric | Oui | Oui |
Évolutivité et résilience de la plateforme | ||
Architecture Premium, qui prend en charge une mise à l’échelle et des performances accrues | Oui | Oui |
Support multigéographique, qui aide les clients multinationaux à répondre aux exigences régionales, spécifiques au secteur ou à la résidence des données organisationnelles | Oui 3 | Oui |
Sécurité | ||
Connectivité de la passerelle de données de réseau virtuel (VNet) permettant à Fabric de fonctionner en toute transparence dans le réseau virtuel d’une organisation | Non | Oui |
Passerelle de données locale connectivité, ce qui permet un accès sécurisé aux données entre les sources de données locales d’une organisation et Fabric | Oui | Oui |
Les balises de service Azure avec le support de sont un groupe défini d'adresses IP gérées automatiquement pour réduire la complexité des mises à jour ou des modifications des règles de sécurité réseau. | Oui | Oui |
Gouvernance | ||
Contenu approbation, pour promouvoir ou certifier des articles en tissu précieux de haute qualité. | Oui | Oui |
Intégration Microsoft Purview, qui aide les clients à gérer et à gouverner les éléments Fabric | Oui | Oui |
Microsoft Information Protection (MIP) étiquettes de sensibilité et intégration avec Microsoft Defender for Cloud Apps pour la protection contre la perte de données (DLP) | Oui | Oui |
Surveillance et journalisation des diagnostics | ||
Amélioration de l'historique d'actualisation , ce qui vous permet d’évaluer en détail ce qui s’est passé pendant l’actualisation de votre flux de données | Non | Oui |
Hub de supervision, qui fournit des fonctionnalités de supervision pour les éléments Fabric | Non | Oui |
Application Métriques de capacité Microsoft Fabric, qui fournit des fonctionnalités de supervision pour la capacité Fabric | Oui | Oui |
Journal d’audit, qui suit les activités des utilisateurs dans Fabric et Microsoft 365 | Oui | Oui |
1 Pour savoir comment créer des fonctions personnalisées qui appellent des points de terminaison d’API Azure AI, consultez Tutoriel : Extraire des expressions clés à partir du texte stocké dans Power BI.
2 Machine Learning automatisé (AutoML) a été déconseillé. Pour plus d’informations, consultez cette annonce officielle.
3 Pour configurer le stockage de flux de données Power BI pour utiliser Azure Data Lake Storage (ADLS) Gen2, consultez cet article.
Considérations
Il existe d’autres considérations à prendre en compte dans votre planification avant de migrer vers Dataflow Gen2.
Licence
Vous avez besoin d’une licence Pro ou Premium par utilisateur (PPU) pour publier ou gérer des flux de données Power BI (Dataflow Gen1). En revanche, vous avez uniquement besoin d’une licence Microsoft Fabric (gratuite) pour créer un Dataflow Gen2 dans un espace de travail de capacité Premium.
Scénarios de migration
Lorsque vous migrez vos flux de données, il est important de réfléchir au-delà de la simple copie de solutions existantes. Au lieu de cela, nous vous recommandons de moderniser vos solutions en tirant parti des dernières innovations et fonctionnalités de Dataflow Gen2. Cette approche garantit que vos solutions peuvent prendre en charge les demandes croissantes de l’entreprise.
Dans l’article scénarios de migration, plusieurs méthodes de mise à niveau, de prise d’inventaire et d’utilisation d’accélérateurs comme modèles Power Query sont décrites. Ces méthodes peuvent vous aider à garantir une mise à niveau transparente pour vos projets.
Feuille de route
Le plan de publication Microsoft Fabric annonce les dernières mises à jour et les calendriers à mesure que les fonctionnalités sont préparées pour des futures versions, y compris les nouveautés et les prévisions de Data Factory dans Microsoft Fabric.
Contenu connexe
Pour plus d’informations sur cet article, consultez les ressources suivantes :