Delen via


Beschikbaarheid van Eventhouse OneLake

U kunt een logische kopie van KQL-databasegegevens maken in een eventhouse door beschikbaarheid van OneLake in te schakelen. Als u OneLake-beschikbaarheid inschakelt, kunt u query's uitvoeren op de gegevens in uw KQL-database in Delta Lake-indeling via andere Fabric-engines, zoals de Direct Lake-modus in Power BI, Warehouse, Lakehouse, Notebooks en meer.

Delta Lake is een uniforme data lake-tabelindeling die naadloze gegevenstoegang biedt voor alle rekenengines in Microsoft Fabric. Zie Wat is Delta Lake? voor meer informatie over Delta Lake.

In dit artikel leert u hoe u de beschikbaarheid van KQL-databasegegevens in OneLake inschakelt.

Hoe het werkt

U kunt de beschikbaarheid van OneLake inschakelen op database- of tabelniveau. Wanneer deze optie is ingeschakeld op databaseniveau, worden alle nieuwe tabellen en de bijbehorende gegevens beschikbaar gesteld in OneLake. Wanneer u de functie inschakelt, kunt u deze optie ook toepassen op bestaande tabellen door de optie Toepassen op bestaande tabellen te selecteren. Als u op tabelniveau inschakelt, worden alleen die tabel en de bijbehorende gegevens beschikbaar in OneLake. Het bewaarbeleid voor gegevens van uw KQL-database wordt ook toegepast op de gegevens in OneLake. Gegevens die zijn verwijderd uit uw KQL-database aan het einde van de bewaarperiode, worden ook verwijderd uit OneLake. Als u OneLake-beschikbaarheiduitschakelt, worden gegevens voorlopig verwijderd uit OneLake.

Hoewel OneLake-beschikbaarheid is ingeschakeld, kunt u de volgende taken niet uitvoeren:

  • De naam van tabellen wijzigen
  • Tabelschema's wijzigen
  • Beveiliging op rijniveau toepassen op tabellen
  • Gegevens kunnen niet worden verwijderd, afgekort of opgeschoond.

Als u een van deze taken wilt uitvoeren, gebruikt u de volgende stappen:

Belangrijk

Wanneer u de beschikbaarheid van OneLake uitschakelt worden uw gegevens tijdelijk uit OneLake verwijderd. Wanneer u de beschikbaarheid weer inschakelt, worden alleen nieuwe gegevens beschikbaar gesteld in OneLake, zonder dat de verwijderde gegevens opnieuw worden ingevuld.

  1. Schakel OneLake-beschikbaarheiduit.

  2. Voer de gewenste taak uit.

  3. Schakel OneLake-beschikbaarheidin.

Belangrijk

Zie Adaptief gedragvoor meer informatie over de tijd die nodig is om gegevens weer te geven in OneLake.

Er zijn geen extra opslagkosten om de beschikbaarheid van OneLake in te schakelen. Zie resourceverbruik voor meer informatie.

Vereisten

  • Een werkruimte met een Capaciteit met Microsoft Fabric
  • Een KQL-database met bewerkingsmachtigingen en gegevens

Beschikbaarheid van OneLake inschakelen

U kunt de beschikbaarheid van OneLake inschakelen op KQL-database of tabelniveau.

  1. Als u de beschikbaarheid van OneLake wilt inschakelen, bladert u naar de sectie OneLake in het detailvenster van uw KQL-database of -tabel.

  2. Stel beschikbaarheid in op Aan.

    Schermopname van de sectie OneLake van het deelvenster Databasedetails met de optie Beschikbaarheid gemarkeerd.

  3. De database wordt automatisch vernieuwd.

    Schermopname van de details van de Sectie OneLake in Real-Time Intelligence zodra beschikbaarheid is ingesteld op Aan. De optie om gegevens beschikbaar te maken voor OneLake is ingeschakeld.

U hebt de beschikbaarheid van OneLake ingeschakeld in uw KQL-database. U hebt nu toegang tot alle nieuwe gegevens die zijn toegevoegd aan uw database op het opgegeven OneLake-pad in Delta Lake-indeling. U kunt er ook voor kiezen om een OneLake-snelkoppeling te maken vanuit een Lakehouse, Data Warehouse of de gegevens rechtstreeks op te vragen via de Direct Lake-modus van Power BI.

Adaptief gedrag

Eventhouse biedt een robuust mechanisme waarmee binnenkomende gegevensstromen op intelligente wijze worden gebatcheerd in een of meer Parquet-bestanden, gestructureerd voor analyse. Batchverwerking van gegevensstromen is belangrijk bij het verwerken van lastige gegevens. Het schrijven van veel kleine Parquet-bestanden naar het meer kan inefficiƫnt zijn, wat resulteert in hogere kosten en slechte prestaties.

Het adaptieve mechanisme van Eventhouse kan schrijfbewerkingen vertragen als er onvoldoende gegevens zijn om optimale Parquet-bestanden te maken. Dit zorgt ervoor dat Parquet-bestanden optimaal zijn en voldoen aan de best practices van Delta Lake. Het adaptieve mechanisme eventhouse zorgt ervoor dat de Parquet-bestanden zijn voorbereid op analyse en zorgt voor een balans tussen de behoefte aan beschikbaarheid van gegevens met kosten- en prestatieoverwegingen.

Notitie

  • De schrijfbewerking kan standaard tot 3 uur duren of totdat bestanden met voldoende grootte (meestal 200-256 MB) worden gemaakt.
  • U kunt de vertraging aanpassen aan een waarde tussen 5 minuten en 3 uur.

Gebruik bijvoorbeeld de volgende opdracht om de vertraging in te stellen op 5 minuten:

.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);

Voorzichtigheid

Het aanpassen van de vertraging tot een kortere periode kan leiden tot een suboptimale deltatabel met een groot aantal kleine bestanden, wat kan leiden tot inefficiƫnte queryprestaties. De resulterende tabel in OneLake heeft het kenmerk Alleen-lezen en kan niet worden geoptimaliseerd na het maken.

U kunt controleren hoe lang geleden nieuwe gegevens in het lake zijn toegevoegd door de gegevenslatentie te controleren met behulp van de opdracht .show table mirroring operations opdracht.

Resultaten worden gemeten vanaf de laatste keer dat gegevens zijn toegevoegd. Wanneer latentie resulteert in 00:00:00, zijn alle gegevens in de KQL-database beschikbaar in OneLake.

Bestanden weergeven

Wanneer u De beschikbaarheid van OneLake voor een tabel inschakelt, wordt er een deltalogboekmap gemaakt, samen met eventuele bijbehorende JSON- en Parquet-bestanden. U kunt de bestanden bekijken die beschikbaar zijn gesteld in OneLake en de bijbehorende eigenschappen terwijl ze in realtime intelligentie blijven.

  • Als u de bestanden wilt weergeven, beweegt u de muisaanwijzer over een tabel in het deelvenster Explorer en selecteert u vervolgens het menu Meer [...]>Bestanden weergeven.

    Schermopname van het deelvenster Explorer met de vervolgkeuzelijst Meer van een tabel.

  • Als u de eigenschappen van de deltalogboekmap of de afzonderlijke bestanden wilt bekijken, beweegt u de muisaanwijzer over de map of het bestand en selecteert u vervolgens het menu Meer [...]>Eigenschappen.

  • De bestanden in de deltalogboekmap weergeven:

    1. Selecteer de map _delta_log .
    2. Selecteer een bestand om de metagegevens en het schema van de tabel weer te geven. De editor die wordt geopend, heeft de indeling alleen-lezen.

Beleid voor toegang tot spiegeling

Wanneer OneLake-beschikbaarheid is ingeschakeld, is standaard een mirroringbeleid ingeschakeld. U kunt het beleid gebruiken om de latentie van gegevens te bewaken of te wijzigen in partitie-deltatabellen.

Notitie

Als u de beschikbaarheid van OneLake uitschakelt

Deltatabellen partitioneren

U kunt uw deltatabellen partitioneren om de querysnelheid te verbeteren. Zie Wanneer kunt u tabellen partitioneren voor informatie over wanneer u uw OneLake-bestanden wilt partitioneren. Elke partitie wordt weergegeven als een afzonderlijke kolom met behulp van de PartitionName die wordt vermeld in de lijst Partities . Dit betekent dat uw OneLake-kopie meer kolommen heeft dan uw brontabel.

Als u uw deltatabellen wilt partitioneren, gebruikt u de opdracht .alter-merge table policy mirroring .