Del via


Hent data fra OneLake

I denne artikel lærer du, hvordan du henter data fra OneLake til enten en ny eller eksisterende tabel.

Forudsætninger

Kopiér filstien fra Lakehouse

  1. Vælg det Lakehouse-miljø, der indeholder den datakilde, du vil bruge, i dit arbejdsområde.

  2. Placer markøren over den ønskede fil, og vælg menuen Mere (...) , og vælg derefter Egenskaber.

    Vigtig

    • Mappestier understøttes ikke.
    • Jokertegn (*) understøttes ikke.

    Skærmbillede af rullemenuen i en Lakehouse-fil. Indstillingen Egenskaber er fremhævet.

  3. Under URL-adresseskal du vælge ikonet Kopiér til Udklipsholder og gemme den et sted, hvor du kan hente den på et senere trin.

    Skærmbillede af ruden Egenskaber for en Lakehouse-fil. Kopiikonet til højre for filens URL-adresse er fremhævet.

  4. Gå tilbage til dit arbejdsområde, og vælg en KQL-database.

Kilde

  1. På det nederste bånd i din KQL-database skal du vælge Hent data.

    I vinduet Hent data vælges fanen Kilde.

  2. Vælg datakilden på den tilgængelige liste. I dette eksempel henter du data fra OneLake.

    Skærmbillede af vinduet Hent data med kildefanen valgt.

Konfigurere

  1. Vælg en destinationstabel. Hvis du vil overføre data til en ny tabel, skal du vælge +Ny tabel og angive et tabelnavn.

    Seddel

    Tabelnavne kan indeholde op til 1024 tegn, herunder mellemrum, alfanumeriske tegn, bindestreger og understregningstegn. Specialtegn understøttes ikke.

  2. I OneLake-filskal du indsætte filstien til det Lakehouse, du kopierede, i Kopiér filsti fra Lakehouse.

    Seddel

    Du kan tilføje op til 10 elementer af op til 1 GB dekomprimeret størrelse hver.

    Skærmbillede af fanen Konfigurer, hvor der er angivet en ny tabel, og der er tilføjet en OneLake-filsti.

  3. Vælg Næste.

Inspicere

Fanen Inspect åbnes med et eksempel på dataene.

Hvis du vil fuldføre indtagelsesprocessen, skal du vælge Udfør.

Skærmbillede af fanen Undersøg.

Eventuelt:

Rediger kolonner

Seddel

  • I forbindelse med tabelformater (CSV, TSV, PSV) kan du ikke tilknytte en kolonne to gange. Hvis du vil knytte til en eksisterende kolonne, skal du først slette den nye kolonne.
  • Du kan ikke ændre en eksisterende kolonnetype. Hvis du forsøger at knytte til en kolonne med et andet format, kan du ende med at have tomme kolonner.

De ændringer, du kan foretage i en tabel, afhænger af følgende parametre:

  • Tabeltype er ny eller eksisterende
  • Tilknytningstypen er ny eller eksisterende
Tabeltype Tilknytningstype Tilgængelige justeringer
Ny tabel Ny tilknytning Omdøb kolonne, skift datatype, skift datakilde, tilknytningstransformation, tilføj kolonne, slet kolonne
Eksisterende tabel Ny tilknytning Tilføj kolonne (hvor du derefter kan ændre datatype, omdøbe og opdatere)
Eksisterende tabel Eksisterende tilknytning ingen

Skærmbillede af kolonner, der er åbne til redigering.

Tilknytning af transformationer

Nogle tilknytninger af dataformater (Parquet, JSON og Avro) understøtter enkle transformationer af indfødningstid. Hvis du vil anvende tilknytningstransformationer, skal du oprette eller opdatere en kolonne i vinduet Rediger kolonner.

Tilknytningstransformationer kan udføres på en kolonne af typen streng eller datetime, hvor kilden har datatypen int eller long. Understøttede tilknytningstransformationer er:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Avancerede indstillinger baseret på datatype

tabel (CSV, TSV, PSV):

  • Hvis du bruger tabelformater i en eksisterende tabel, kan du vælge Avanceret>Bevar tabelskema. Tabeldata indeholder ikke nødvendigvis de kolonnenavne, der bruges til at knytte kildedata til de eksisterende kolonner. Når denne indstilling er markeret, udføres tilknytningen efter rækkefølge, og tabelskemaet forbliver det samme. Hvis denne indstilling ikke er markeret, oprettes der nye kolonner til indgående data, uanset datastruktur.

  • Hvis du vil bruge den første række som kolonnenavne, skal du vælge Avanceret>Første række er kolonneoverskrift.

    Skærmbillede af avancerede CSV-indstillinger.

JSON-:

  • Hvis du vil bestemme kolonneopdelingen af JSON-data, skal du vælge Avancerede>Indlejrede niveauerfra 1 til 100.

  • Hvis du vælger Avanceret>Spring JSON-linjer over med fejl, indtages dataene i JSON-format. Hvis du ikke markerer dette afkrydsningsfelt, indtages dataene i multijsonformat.

    Skærmbillede af avancerede JSON-indstillinger.

Resumé

I vinduet Dataforberedelse er alle tre trin markeret med grønne markeringer, når dataindtagelse er fuldført. Du kan vælge et kort, der skal forespørges om, slippe de data, der er indtaget, eller se et dashboard med oversigten over indtagelse.

Skærmbillede af oversigtsside, hvor en vellykket indtagelse er fuldført.