Gegevens ophalen uit OneLake
In dit artikel leert u hoe u gegevens uit OneLake kunt ophalen in een nieuwe of bestaande tabel.
Vereisten
- Een werkruimte met een Capaciteit met Microsoft Fabric
- Een Lakehouse
- Een KQL-database met bewerkingsmachtigingen
Bestandspad kopiëren vanuit Lakehouse
Kies in de ervaringswisselaar Data-engineer ing.
Selecteer de Lakehouse-omgeving met de gegevensbron die u wilt gebruiken.
Plaats de cursor op het gewenste bestand en selecteer het menu Meer en selecteer Vervolgens Eigenschappen.
Belangrijk
- Mappaden worden niet ondersteund.
- Jokertekens (*) worden niet ondersteund.
Selecteer onder URL het pictogram Kopiëren naar klembord en sla het ergens op om op te halen in een latere stap.
Ga terug naar uw werkruimte en selecteer een KQL-database.
Bron
Selecteer Gegevens ophalen op het onderste lint van uw KQL-database.
In het venster Gegevens ophalen is het tabblad Bron geselecteerd.
Selecteer de gegevensbron in de beschikbare lijst. In dit voorbeeld neemt u gegevens op uit OneLake.
Configureren
Selecteer een doeltabel. Als u gegevens wilt opnemen in een nieuwe tabel, selecteert u +Nieuwe tabel en voert u een tabelnaam in.
Notitie
Tabelnamen kunnen maximaal 1024 tekens zijn, waaronder spaties, alfanumerieke, afbreekstreepjes en onderstrepingstekens. Speciale tekens worden niet ondersteund.
Plak in het OneLake-bestand het bestandspad van het Lakehouse dat u hebt gekopieerd in het pad Naar het bestand kopiëren vanuit Lakehouse.
Notitie
U kunt maximaal 10 items van maximaal 1 GB ongecomprimeerd formaat toevoegen.
Selecteer Volgende.
Inspecteren
Het tabblad Inspecteren wordt geopend met een voorbeeld van de gegevens.
Selecteer Voltooien om het opnameproces te voltooien.
Optioneel:
- Selecteer Opdrachtviewer om de automatische opdrachten weer te geven en te kopiëren die zijn gegenereerd op basis van uw invoer.
- Gebruik de vervolgkeuzelijst Schemadefinitiebestand om het bestand te wijzigen waaruit het schema is afgeleid.
- Wijzig de automatisch uitgestelde gegevensindeling door de gewenste indeling in de vervolgkeuzelijst te selecteren. Zie Gegevensindelingen die worden ondersteund door Realtime Intelligence voor meer informatie.
- Kolommen bewerken.
- Verken geavanceerde opties op basis van het gegevenstype.
Kolommen bewerken
Notitie
- Voor tabelindelingen (CSV, TSV, PSV) kunt u een kolom niet twee keer toewijzen. Als u wilt toewijzen aan een bestaande kolom, verwijdert u eerst de nieuwe kolom.
- U kunt een bestaand kolomtype niet wijzigen. Als u probeert toe te wijzen aan een kolom met een andere indeling, kunt u uiteindelijk lege kolommen gebruiken.
De wijzigingen die u in een tabel kunt aanbrengen, zijn afhankelijk van de volgende parameters:
- Tabeltype is nieuw of bestaand
- Toewijzingstype is nieuw of bestaand
Tabeltype | Toewijzingstype | Beschikbare aanpassingen |
---|---|---|
Nieuwe tabel | Nieuwe toewijzing | Naam van kolom wijzigen, gegevenstype wijzigen, gegevensbron wijzigen, toewijzingstransformatie, kolom toevoegen, kolom verwijderen |
Bestaande tabel | Nieuwe toewijzing | Kolom toevoegen (waarop u vervolgens het gegevenstype, de naam kunt wijzigen en bijwerken) |
Bestaande tabel | Bestaande toewijzing | Geen |
Toewijzingstransformaties
Sommige toewijzingen van gegevensindelingen (Parquet, JSON en Avro) bieden ondersteuning voor eenvoudige opnametijdtransformaties. Als u toewijzingstransformaties wilt toepassen, maakt of werkt u een kolom in het venster Kolommen bewerken.
Toewijzingstransformaties kunnen worden uitgevoerd op een kolom van het type tekenreeks of datum/tijd, waarbij de bron gegevenstype int of lang heeft. Ondersteunde toewijzingstransformaties zijn:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconden
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Geavanceerde opties op basis van gegevenstype
Tabellair (CSV, TSV, PSV):
Als u tabelindelingen in tabelvorm opneemt in een bestaande tabel, kunt u geavanceerd>tabelschema behouden selecteren. Tabelgegevens bevatten niet noodzakelijkerwijs de kolomnamen die worden gebruikt om brongegevens toe te wijzen aan de bestaande kolommen. Wanneer deze optie is ingeschakeld, wordt de toewijzing op volgorde uitgevoerd en blijft het tabelschema hetzelfde. Als deze optie is uitgeschakeld, worden nieuwe kolommen gemaakt voor binnenkomende gegevens, ongeacht de gegevensstructuur.
Als u de eerste rij als kolomnamen wilt gebruiken, selecteert u Geavanceerde>eerste rij een kolomkop.
JSON:
Als u de kolomverdeling van JSON-gegevens wilt bepalen, selecteert u Geavanceerde>geneste niveaus, van 1 tot en met 100.
Als u Geavanceerde>JSON-regels met fouten selecteert, worden de gegevens opgenomen in JSON-indeling. Als u dit selectievakje uitgeschakeld laat, worden de gegevens opgenomen in multijson-indeling.
Samenvatting
In het venster Gegevensvoorbereiding worden alle drie de stappen gemarkeerd met groene vinkjes wanneer de gegevensopname is voltooid. U kunt een kaart selecteren om een query uit te voeren, de opgenomen gegevens te verwijderen of een dashboard van uw opnameoverzicht te bekijken.