Gegevens ophalen uit Azure Storage
In dit artikel leert u hoe u gegevens opvragen uit Azure Storage (ADLS Gen2-container, blobcontainer of afzonderlijke blobs) in een nieuwe of bestaande tabel.
Vereisten
- Een werkruimte met een Capaciteit met Microsoft Fabric
- Een KQL-database met bewerkingsmachtigingen
- Een opslagaccount
Bron
Selecteer Gegevens ophalen op het onderste lint van uw KQL-database.
In het venster Gegevens ophalen is het tabblad Bron geselecteerd.
Selecteer de gegevensbron in de beschikbare lijst. In dit voorbeeld neemt u gegevens op uit Azure Storage.
Configureren
Selecteer een doeltabel. Als u gegevens wilt opnemen in een nieuwe tabel, selecteert u + Nieuwe tabel en voert u een tabelnaam in.
Notitie
Tabelnamen kunnen maximaal 1024 tekens zijn, waaronder spaties, alfanumerieke, afbreekstreepjes en onderstrepingstekens. Speciale tekens worden niet ondersteund.
Als u uw gegevensbron wilt toevoegen, plakt u uw opslag verbindingsreeks in het veld URI en selecteert u +. De volgende tabel bevat de ondersteunde verificatiemethoden en de machtigingen die nodig zijn voor het opnemen van gegevens uit Azure Storage.
Verificatiemethode Afzonderlijke blob Blobcontainer Azure Data Lake Storage Gen2 SAS-token (Shared Access) Lezen en schrijven Lezen en weergeven Lezen en weergeven Toegangssleutel voor opslagaccount Notitie
- U kunt maximaal 10 afzonderlijke blobs toevoegen of maximaal 5000 blobs uit één container opnemen. U kunt beide niet tegelijk opnemen.
- Elke blob kan maximaal 1 GB ongecomprimeerd zijn.
Als u een verbindingsreeks hebt geplakt voor een blobcontainer of een Azure Data Lake Storage Gen2, kunt u vervolgens de volgende optionele filters toevoegen:
Instelling Veldomschrijving Bestandsfilters (optioneel) Folder path Hiermee filtert u gegevens om bestanden op te nemen met een specifiek mappad. Bestandsextensie Hiermee filtert u gegevens om alleen bestanden op te nemen met een specifieke bestandsextensie.
Selecteer Volgende
Inspecteren
Het tabblad Inspecteren wordt geopend met een voorbeeld van de gegevens.
Selecteer Voltooien om het opnameproces te voltooien.
Optioneel:
- Selecteer Opdrachtviewer om de automatische opdrachten weer te geven en te kopiëren die zijn gegenereerd op basis van uw invoer.
- Gebruik de vervolgkeuzelijst Schemadefinitiebestand om het bestand te wijzigen waaruit het schema is afgeleid.
- Wijzig de automatisch uitgestelde gegevensindeling door de gewenste indeling in de vervolgkeuzelijst te selecteren. Zie Gegevensindelingen die worden ondersteund door Realtime Intelligence voor meer informatie.
- Kolommen bewerken.
- Verken geavanceerde opties op basis van het gegevenstype.
Kolommen bewerken
Notitie
- Voor tabelindelingen (CSV, TSV, PSV) kunt u een kolom niet twee keer toewijzen. Als u wilt toewijzen aan een bestaande kolom, verwijdert u eerst de nieuwe kolom.
- U kunt een bestaand kolomtype niet wijzigen. Als u probeert toe te wijzen aan een kolom met een andere indeling, kunt u uiteindelijk lege kolommen gebruiken.
De wijzigingen die u in een tabel kunt aanbrengen, zijn afhankelijk van de volgende parameters:
- Tabeltype is nieuw of bestaand
- Toewijzingstype is nieuw of bestaand
Tabeltype | Toewijzingstype | Beschikbare aanpassingen |
---|---|---|
Nieuwe tabel | Nieuwe toewijzing | Naam van kolom wijzigen, gegevenstype wijzigen, gegevensbron wijzigen, toewijzingstransformatie, kolom toevoegen, kolom verwijderen |
Bestaande tabel | Nieuwe toewijzing | Kolom toevoegen (waarop u vervolgens het gegevenstype, de naam kunt wijzigen en bijwerken) |
Bestaande tabel | Bestaande toewijzing | Geen |
Toewijzingstransformaties
Sommige toewijzingen van gegevensindelingen (Parquet, JSON en Avro) bieden ondersteuning voor eenvoudige opnametijdtransformaties. Als u toewijzingstransformaties wilt toepassen, maakt of werkt u een kolom in het venster Kolommen bewerken.
Toewijzingstransformaties kunnen worden uitgevoerd op een kolom van het type tekenreeks of datum/tijd, waarbij de bron gegevenstype int of lang heeft. Ondersteunde toewijzingstransformaties zijn:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconden
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Geavanceerde opties op basis van gegevenstype
Tabellair (CSV, TSV, PSV):
Als u tabelindelingen in tabelvorm opneemt in een bestaande tabel, kunt u geavanceerd>tabelschema behouden selecteren. Tabelgegevens bevatten niet noodzakelijkerwijs de kolomnamen die worden gebruikt om brongegevens toe te wijzen aan de bestaande kolommen. Wanneer deze optie is ingeschakeld, wordt de toewijzing op volgorde uitgevoerd en blijft het tabelschema hetzelfde. Als deze optie is uitgeschakeld, worden nieuwe kolommen gemaakt voor binnenkomende gegevens, ongeacht de gegevensstructuur.
Als u de eerste rij als kolomnamen wilt gebruiken, selecteert u Geavanceerde>eerste rij een kolomkop.
JSON:
Als u de kolomverdeling van JSON-gegevens wilt bepalen, selecteert u Geavanceerde>geneste niveaus, van 1 tot en met 100.
Als u Geavanceerde>JSON-regels met fouten selecteert, worden de gegevens opgenomen in JSON-indeling. Als u dit selectievakje uitgeschakeld laat, worden de gegevens opgenomen in multijson-indeling.
Samenvatting
In het venster Gegevensvoorbereiding worden alle drie de stappen gemarkeerd met groene vinkjes wanneer de gegevensopname is voltooid. U kunt een kaart selecteren om een query uit te voeren, de opgenomen gegevens te verwijderen of een dashboard van uw opnameoverzicht te bekijken.
Gerelateerde inhoud
- Zie Gegevens beheren om uw database te beheren
- Als u query's wilt maken, opslaan en exporteren, raadpleegt u Querygegevens in een KQL-queryset