Gegevens ophalen uit Amazon S3
In dit artikel leert u hoe u gegevens van Amazon S3 kunt ophalen in een nieuwe of bestaande tabel. Amazon S3 is een service voor objectopslag die is gebouwd om gegevens op te slaan en op te halen.
Zie Wat is Amazon S3? voor meer informatie over Amazon S3.
Vereisten
- Een werkruimte met een Capaciteit met Microsoft Fabric
- Een KQL-database met bewerkingsmachtigingen
- Een Amazon S3-bucket met gegevens
Bron
Selecteer Gegevens ophalen op het onderste lint van uw KQL-database.
In het venster Gegevens ophalen is het tabblad Bron geselecteerd.
Selecteer de gegevensbron in de beschikbare lijst. In dit voorbeeld neemt u gegevens op uit Amazon S3.
Configureren
Selecteer een doeltabel. Als u gegevens wilt opnemen in een nieuwe tabel, selecteert u +Nieuwe tabel en voert u een tabelnaam in.
Notitie
Tabelnamen kunnen maximaal 1024 tekens zijn, waaronder spaties, alfanumerieke, afbreekstreepjes en onderstrepingstekens. Speciale tekens worden niet ondersteund.
Plak in het URI-veld de verbindingsreeks van één bucket of een afzonderlijk object in de volgende indeling.
Bucket:
https://
BucketName.s3.
RegionName.amazonaws.com;AwsCredentials=
AwsAccessID,
AwsSecretKeyU kunt desgewenst bucketfilters toepassen om gegevens te filteren op basis van een specifieke bestandsextensie.
Selecteer Volgende.
Inspecteren
Het tabblad Inspecteren wordt geopend met een voorbeeld van de gegevens.
Selecteer Voltooien om het opnameproces te voltooien.
Optioneel:
- Selecteer Opdrachtviewer om de automatische opdrachten weer te geven en te kopiëren die zijn gegenereerd op basis van uw invoer.
- Gebruik de vervolgkeuzelijst Schemadefinitiebestand om het bestand te wijzigen waaruit het schema is afgeleid.
- Wijzig de automatisch uitgestelde gegevensindeling door de gewenste indeling in de vervolgkeuzelijst te selecteren. Zie Gegevensindelingen die worden ondersteund door Realtime Intelligence voor meer informatie.
- Kolommen bewerken.
- Verken geavanceerde opties op basis van het gegevenstype.
Kolommen bewerken
Notitie
- Voor tabelindelingen (CSV, TSV, PSV) kunt u een kolom niet twee keer toewijzen. Als u wilt toewijzen aan een bestaande kolom, verwijdert u eerst de nieuwe kolom.
- U kunt een bestaand kolomtype niet wijzigen. Als u probeert toe te wijzen aan een kolom met een andere indeling, kunt u uiteindelijk lege kolommen gebruiken.
De wijzigingen die u in een tabel kunt aanbrengen, zijn afhankelijk van de volgende parameters:
- Tabeltype is nieuw of bestaand
- Toewijzingstype is nieuw of bestaand
Tabeltype | Toewijzingstype | Beschikbare aanpassingen |
---|---|---|
Nieuwe tabel | Nieuwe toewijzing | Naam van kolom wijzigen, gegevenstype wijzigen, gegevensbron wijzigen, toewijzingstransformatie, kolom toevoegen, kolom verwijderen |
Bestaande tabel | Nieuwe toewijzing | Kolom toevoegen (waarop u vervolgens het gegevenstype, de naam kunt wijzigen en bijwerken) |
Bestaande tabel | Bestaande toewijzing | Geen |
Toewijzingstransformaties
Sommige toewijzingen van gegevensindelingen (Parquet, JSON en Avro) bieden ondersteuning voor eenvoudige opnametijdtransformaties. Als u toewijzingstransformaties wilt toepassen, maakt of werkt u een kolom in het venster Kolommen bewerken.
Toewijzingstransformaties kunnen worden uitgevoerd op een kolom van het type tekenreeks of datum/tijd, waarbij de bron gegevenstype int of lang heeft. Ondersteunde toewijzingstransformaties zijn:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconden
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Geavanceerde opties op basis van gegevenstype
Tabellair (CSV, TSV, PSV):
Als u tabelindelingen in tabelvorm opneemt in een bestaande tabel, kunt u geavanceerd>tabelschema behouden selecteren. Tabelgegevens bevatten niet noodzakelijkerwijs de kolomnamen die worden gebruikt om brongegevens toe te wijzen aan de bestaande kolommen. Wanneer deze optie is ingeschakeld, wordt de toewijzing op volgorde uitgevoerd en blijft het tabelschema hetzelfde. Als deze optie is uitgeschakeld, worden nieuwe kolommen gemaakt voor binnenkomende gegevens, ongeacht de gegevensstructuur.
Als u de eerste rij als kolomnamen wilt gebruiken, selecteert u Geavanceerde>eerste rij een kolomkop.
JSON:
Als u de kolomverdeling van JSON-gegevens wilt bepalen, selecteert u Geavanceerde>geneste niveaus, van 1 tot en met 100.
Als u Geavanceerde>JSON-regels met fouten selecteert, worden de gegevens opgenomen in JSON-indeling. Als u dit selectievakje uitgeschakeld laat, worden de gegevens opgenomen in multijson-indeling.
Samenvatting
In het venster Gegevensvoorbereiding worden alle drie de stappen gemarkeerd met groene vinkjes wanneer de gegevensopname is voltooid. U kunt een kaart selecteren om een query uit te voeren, de opgenomen gegevens te verwijderen of een dashboard van uw opnameoverzicht te bekijken.
Gerelateerde inhoud
- Zie Gegevens beheren om uw database te beheren
- Als u query's wilt maken, opslaan en exporteren, raadpleegt u Querygegevens in een KQL-queryset