Disponibilité d’Eventhouse OneLake
Vous pouvez créer une copie logique des données de la base de données KQL dans un entrepôt d'événements en activant l'option Disponibilité de OneLake. Activer la disponibilité de OneLake signifie que vous pouvez interroger les données de votre base de données KQL au format Delta Lake via d'autres moteurs Fabric comme le mode Direct Lake dans Power BI, Warehouse, Lakehouse, Notebooks, etc.
Delta Lake est un format de table de lac de données unifié qui permet d’obtenir un accès fluide aux données entre tous les moteurs de calcul dans Microsoft Fabric. Pour plus d’informations sur Delta Lake, consultez Qu’est-ce que Delta Lake ?.
Dans cet article, vous allez apprendre à activer la disponibilité des données de base de données KQL dans OneLake.
Fonctionnement
Vous pouvez activer Disponibilité de OneLake au niveau de la base de données ou de la table. Lorsqu’elles sont activées au niveau de la base de données, toutes les nouvelles tables et leurs données sont disponibles dans OneLake. Lorsque vous activez la fonctionnalité, vous pouvez également choisir d’appliquer cette option à des tables existantes en sélectionnant l’option Appliquer aux tables existantes. L’activation au niveau de la table rend uniquement cette table et ses données disponibles dans OneLake. La stratégie de rétention des données de votre base de données KQL est également appliquée aux données dans OneLake. Les données supprimées de votre base de données KQL à la fin de la période de conservation sont également supprimées de OneLake. Si vous désactivez disponibilité OneLake, les données sont supprimées de OneLake de manière réversible.
Tant que la disponibilité de OneLake est activée, vous ne pouvez pas effectuer les tâches suivantes :
- Renommer des tables
- Modifier les schémas de table
- Appliquer la sécurité au niveau des lignes aux tables
- Les données ne peuvent pas être supprimées, tronquées ou vidées
Si vous devez effectuer l’une de ces tâches, procédez comme suit :
Important
Désactiver disponibilité oneLake supprime vos données de OneLake. Lorsque vous réactivez la disponibilité, seules les nouvelles données sont mises à disposition dans OneLake sans retour des données supprimées.
Désactivez la disponibilité OneLake.
Effectuez la tâche souhaitée.
Allumer Disponibilité de OneLake.
Important
Pour plus d’informations sur le temps nécessaire à l’affichage des données dans OneLake, consultez comportement adaptatif.
Il n’existe aucun coût de stockage supplémentaire pour activer la disponibilité OneLake. Pour plus d’informations, consultez Consommation de ressources.
Prérequis
- Un espace de travail avec une capacité compatible Microsoft Fabric
- Une base de données KQL avec des autorisations de modification et des données
Activer la disponibilité de OneLake
Vous pouvez activer la disponibilité de OneLake au niveau d'une base de données KQL ou d'une table.
Pour activer la Disponibilité de OneLake, accédez à la section OneLake du volet d’informations de votre base de données ou table KQL.
Définissez la Disponibilité sur Activée.
La base de données s’actualise automatiquement.
Vous avez activé la disponibilité de OneLake dans votre base de données KQL. Vous pouvez désormais accéder à toutes les nouvelles données ajoutées à votre base de données au chemin OneLake donné au format Delta Lake. Vous pouvez également choisir de créer un raccourci OneLake à partir d’un Lakehouse ou d’un Data Warehouse, ou d’interroger les données directement via le mode Direct Lake de Power BI.
Comportement adaptatif
Eventhouse offre un mécanisme robuste qui regroupe intelligemment les flux de données entrants dans un ou plusieurs fichiers Parquet, structurés pour l'analyse. La mise en lots des flux de données est importante lorsqu'il s'agit de traiter des données au compte-gouttes. L'écriture d'un grand nombre de petits fichiers Parquet dans le lac peut être inefficace et entraîner des coûts plus élevés et des performances médiocres.
Le mécanisme adaptatif d’Eventhouse peut retarder les opérations d’écriture s’il n’y a pas suffisamment de données pour créer des fichiers Parquet optimaux. Cela garantit que les fichiers Parquet ont une taille optimale et qu'ils respectent les meilleures pratiques de Delta Lake. Le mécanisme adaptatif d'Eventhouse garantit que les fichiers Parquet sont prêts pour l'analyse et concilie la nécessité d'une disponibilité rapide des données avec les considérations de coût et de performance.
Remarque
- Par défaut, l’opération d’écriture peut prendre jusqu’à 3 heures ou jusqu’à ce que les fichiers de taille suffisante (généralement de 200 à 256 Mo) soient créés.
- Vous pouvez ajuster le délai à une valeur comprise entre 5 minutes et 3 heures.
Par exemple, utilisez la commande suivante pour définir le délai sur 5 minutes :
.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);
Avertissement
L’ajustement du délai à une période plus courte peut entraîner une table delta non optimale avec un grand nombre de petits fichiers, ce qui peut entraîner des performances de requête inefficaces. La table résultante dans OneLake est en lecture seule et ne peut pas être optimisée après la création.
Vous pouvez surveiller le moment où de nouvelles données ont été ajoutées au lac en vérifiant la latence de vos données à l’aide de la commande .show des opérations de mise en miroir de tables.
Les résultats sont mesurés à partir de la dernière fois que des données ont été ajoutées. Lorsque le résultat de la latence est 00:00:00, toutes les données de la base de données KQL sont disponibles dans OneLake.
Afficher des fichiers
Lorsque vous activez la disponibilité de OneLake sur une table, un dossier de journal delta est créé avec tous les fichiers JSON et Parquet correspondants. Vous pouvez afficher les fichiers mis à disposition dans OneLake et leurs propriétés tout en restant dans Real-Time Intelligence.
Pour afficher les fichiers, passez sur une des tables dans le volet Explorateur, puis sélectionnez le Plus de menus [...]>Afficher les fichiers.
Pour afficher les propriétés du dossier du journal delta ou des fichiers individuels, passez sur le dossier ou fichier, puis sélectionnez Plus de menus [...]>Propriétés.
Pour afficher les fichiers dans le dossier delta log :
- Sélectionnez le dossier _delta_log.
- Sélectionnez un fichier pour afficher les métadonnées et le schéma de la table. L'éditeur qui s'ouvre est au format en lecture seule.
Politique de mise en miroir des accès
Par défaut, lorsque la disponibilité de OneLake est activée, une politique de mise en miroir est activée. Vous pouvez utiliser la stratégie pour surveiller la latence des données ou la modifier pour partitionner les tables delta.
Remarque
Si vous désactivez la disponibilité de OneLake, la propriété de la politique de mise en miroir IsEnabled
est fixée à false (IsEnabled=false
).
Partition des tables delta
Vous pouvez partitionner vos tables delta pour améliorer la vitesse des requêtes. Pour savoir quand partitionner vos fichiers OneLake, voir Quand partitionner les tables. Chaque partition est représentée par une colonne distincte utilisant le nom de partition figurant dans la liste des partitions. Cela signifie que votre copie OneLake a plus de colonnes que votre table source.
Pour partitionner vos tables delta, utilisez la commande .alter-merge table policy mirroring.
Contenu connexe
- Pour exposer les données dans OneLake, consultez Créer un raccourci dans OneLake.
- Pour créer un raccourci OneLake dans Lakehouse, consultez À quoi correspondent les raccourcis dans un lakehouse ?.
- Pour interroger des données référencées à partir de OneLake dans votre base de données ou table KQL, consultez Créer un raccourci OneLake dans la base de données KQL