Beschikbaarheid van Eventhouse OneLake
U kunt een logische kopie van KQL-databasegegevens maken in een eventhouse door de beschikbaarheid van OneLake in te schakelen. Als u OneLake-beschikbaarheid inschakelt, kunt u query's uitvoeren op de gegevens in uw KQL-database in Delta Lake-indeling via andere Fabric-engines, zoals de Direct Lake-modus in Power BI, Warehouse, Lakehouse, Notebooks en meer.
Delta Lake is een uniforme data lake-tabelindeling die naadloze gegevenstoegang biedt voor alle rekenengines in Microsoft Fabric. Zie Wat is Delta Lake? voor meer informatie over Delta Lake.
In dit artikel leert u hoe u de beschikbaarheid van KQL-databasegegevens in OneLake inschakelt.
Hoe het werkt
In de volgende tabel wordt het gedrag van uw KQL-database en -tabellen beschreven wanneer u De beschikbaarheid van OneLake inschakelt of uitschakelt.
Ingeschakeld | Uitgeschakeld | |
---|---|---|
KQL-database | - Dit heeft geen invloed op bestaande tabellen. Nieuwe tabellen worden beschikbaar gesteld in OneLake. - Het bewaarbeleid voor gegevens van uw KQL-database wordt ook toegepast op de gegevens in OneLake. Gegevens die zijn verwijderd uit uw KQL-database aan het einde van de bewaarperiode, worden ook verwijderd uit OneLake. |
- Dit heeft geen invloed op bestaande tabellen. Nieuwe tabellen zijn niet beschikbaar in OneLake. |
Een tabel in KQL Database | - Nieuwe gegevens worden beschikbaar gesteld in OneLake. - Bestaande gegevens worden niet teruggevuld. - Gegevens kunnen niet worden verwijderd, afgekapt of verwijderd. - Tabelschema kan niet worden gewijzigd en de naam van de tabel kan niet worden gewijzigd. - Beveiliging op rijniveau kan niet worden toegepast op de tabel. |
- Nieuwe gegevens worden niet beschikbaar gesteld in OneLake. - Gegevens kunnen worden verwijderd, afgekapt of verwijderd. - Tabelschema kan worden gewijzigd en de naam van de tabel kan worden gewijzigd. - Gegevens worden voorlopig verwijderd uit OneLake. |
Belangrijk
Het kan enkele uren duren voordat de gegevens worden weergegeven in OneLake. Zie Adaptief gedrag voor meer informatie.
Er zijn geen extra opslagkosten om de beschikbaarheid van OneLake in te schakelen. Zie resourceverbruik voor meer informatie.
Vereisten
- Een werkruimte met een Capaciteit met Microsoft Fabric
- Een KQL-database met bewerkingsmachtigingen en gegevens
Beschikbaarheid van OneLake inschakelen
U kunt de beschikbaarheid van OneLake inschakelen op KQL-database of tabelniveau.
Als u de beschikbaarheid van OneLake wilt inschakelen, bladert u naar de sectie OneLake in het detailvenster van uw KQL-database of -tabel.
Stel beschikbaarheid in op Aan.
De database wordt automatisch vernieuwd.
U hebt de beschikbaarheid van OneLake ingeschakeld in uw KQL-database. U hebt nu toegang tot alle nieuwe gegevens die zijn toegevoegd aan uw database op het opgegeven OneLake-pad in Delta Lake-indeling. U kunt er ook voor kiezen om een OneLake-snelkoppeling te maken vanuit een Lakehouse, Data Warehouse of de gegevens rechtstreeks op te vragen via de Direct Lake-modus van Power BI.
Adaptief gedrag
Eventhouse biedt een robuust mechanisme waarmee binnenkomende gegevensstromen op intelligente wijze worden gebatcheerd in een of meer Parquet-bestanden, gestructureerd voor analyse. Batchverwerking van gegevensstromen is belangrijk bij het verwerken van lastige gegevens. Het schrijven van veel kleine Parquet-bestanden naar het meer kan inefficiƫnt zijn, wat resulteert in hogere kosten en slechte prestaties.
Het adaptieve mechanisme van Eventhouse kan schrijfbewerkingen tot een paar uur vertragen als er onvoldoende gegevens zijn om optimale Parquet-bestanden te maken. Dit zorgt ervoor dat Parquet-bestanden optimaal zijn en voldoen aan de best practices van Delta Lake. Het adaptieve mechanisme eventhouse zorgt ervoor dat de Parquet-bestanden zijn voorbereid op analyse en zorgt voor een balans tussen de behoefte aan beschikbaarheid van gegevens met kosten- en prestatieoverwegingen.
U kunt controleren hoe lang geleden nieuwe gegevens in het lake zijn toegevoegd door de gegevenslatentie te controleren met behulp van de opdracht .show table mirroring operations.
Resultaten worden gemeten vanaf de laatste keer dat gegevens zijn toegevoegd. Wanneer latentie resulteert in 00:00:00, zijn alle gegevens in de KQL-database beschikbaar in OneLake.
Bestanden weergeven
Wanneer u De beschikbaarheid van OneLake voor een tabel inschakelt, wordt er een deltalogboekmap gemaakt, samen met eventuele bijbehorende JSON- en Parquet-bestanden. U kunt de bestanden bekijken die beschikbaar zijn gesteld in OneLake en de bijbehorende eigenschappen terwijl ze in realtime intelligentie blijven.
Als u de bestanden wilt weergeven, beweegt u de muisaanwijzer over een tabel in het deelvenster Explorer en selecteert u vervolgens het menu Meer [...]>Bestanden weergeven.
Als u de eigenschappen van de deltalogboekmap of de afzonderlijke bestanden wilt bekijken, beweegt u de muisaanwijzer over de map of het bestand en selecteert u vervolgens het menu Meer [...]>Eigenschappen.
De bestanden in de deltalogboekmap weergeven:
- Selecteer de map _delta_log .
- Selecteer een bestand om de metagegevens en het schema van de tabel weer te geven. De editor die wordt geopend, heeft de indeling alleen-lezen.
Beleid voor toegang tot spiegeling
Wanneer OneLake-beschikbaarheid is ingeschakeld, is standaard een mirroringbeleid ingeschakeld. U kunt het beleid gebruiken om de latentie van gegevens te bewaken of te wijzigen in partitie-deltatabellen.
Notitie
Als u de beschikbaarheid van OneLake uitschakelt, wordt de eigenschap van IsEnabled
het spiegelingsbeleid ingesteld op false (IsEnabled=false
).
Deltatabellen partitioneren
U kunt uw deltatabellen partitioneren om de querysnelheid te verbeteren. Zie Wanneer kunt u tabellen partitioneren voor informatie over wanneer u uw OneLake-bestanden wilt partitioneren. Elke partitie wordt weergegeven als een afzonderlijke kolom met behulp van de PartitionName die wordt vermeld in de lijst Partities . Dit betekent dat uw OneLake-kopie meer kolommen heeft dan uw brontabel.
Als u uw deltatabellen wilt partitioneren, gebruikt u de opdracht .alter-merge table policy mirroring .
Gerelateerde inhoud
- Zie Een snelkoppeling maken in OneLake om de gegevens beschikbaar te maken in OneLake
- Zie Wat zijn snelkoppelingen in Lakehouse om een OneLake-snelkoppeling te maken in Lakehouse?
- Zie Een Snelkoppeling naar OneLake maken in KQL Database om een query uit te voeren op gegevens uit OneLake in uw KQL-database