Jaa


Tietojen noutaminen OneLakesta

Tässä artikkelissa opit noutamaan tietoja OneLakesta joko uuteen tai olemassa olevaan taulukkoon.

Edellytykset

Kopioi tiedostopolku Lakehousesta

  1. Valitse työtilasta Lakehouse-ympäristö, joka sisältää tietolähteen, jota haluat käyttää.

  2. Aseta kohdistin haluamasi tiedoston kohdalle ja valitse Lisää (...) - valikko ja valitse sitten Ominaisuudet.

    Tärkeä

    • Kansiopolkuja ei tueta.
    • Yleismerkkejä (*) ei tueta.

    Näyttökuva Lakehouse-tiedoston avattavasta valikosta. Ominaisuudet-niminen asetus näkyy korostettuna.

  3. Valitse URL-osoitteen-kohdasta Kopioi leikepöydälle - kuvake ja tallenna se jonnekin kohtaan, jotta voit noutaa sen myöhemmässä vaiheessa.

    Näyttökuva Lakehouse-tiedoston Ominaisuudet-ruudusta. Tiedoston URL-osoitteen oikealla puolella oleva kopiointikuvake näkyy korostettuna.

  4. Palaa työtilaasi ja valitse KQL-tietokanta.

Lähde

  1. Valitse KQL-tietokannan alemmasta valintanauhasta Nouda tiedot.

    Nouda tiedot -ikkunassa on valittuna Source -välilehti.

  2. Valitse tietolähde käytettävissä olevasta luettelosta. Tässä esimerkissä käsittelet OneLaketietoja.

    Näyttökuva Nouda tiedot -ikkunasta Lähde-välilehti valittuna.

Konfiguroida

  1. Valitse kohdetaulukko. Jos haluat käyttää tietoja uuteen taulukkoon, valitse +Uusi taulukko ja anna taulukon nimi.

    Muistiinpano

    Taulukon nimessä voi olla enintään 1 024 merkkiä, mukaan lukien välilyönnit, aakkosnumeeriset yhdysmerkit, tavuviivat ja alaviivat. Erikoismerkkejä ei tueta.

  2. Liitä OneLaketiedostonkopioimasi Lakehouse-tiedoston polku Kopioi tiedostopolku Lakehouse.

    Muistiinpano

    Voit lisätä enintään 10 kohdetta, joiden koko on enintään 1 Gigatavua.

    Näyttökuva välilehden määrittämisestä, uusi taulukko syötettynä ja OneLake-tiedostopolku lisättynä.

  3. Valitse Seuraava.

Tarkastaa

Tutki -välilehti avautuu tietojen esikatselun kanssa.

Viimeistele käsittelyprosessi valitsemalla Lopeta.

Näyttökuva tarkistusvälilehdestä.

Valinnaisesti:

Muokkaa sarakkeita

Muistiinpano

  • Taulukkomuotoisissa muodoissa (CSV, TSV, PSV) saraketta ei voi yhdistää kahdesti. Jos haluat yhdistää aiemmin luotuun sarakkeeseen, poista ensin uusi sarake.
  • Et voi muuttaa olemassa olevaa saraketyyppiä. Jos yrität yhdistää sarakkeeseen, jonka muoto on erilainen, saatat päätyä tyhjiin sarakkeisiin.

Taulukossa tekemäsi muutokset riippuvat seuraavista parametreista:

  • Taulukon tyyppi on uusi tai olemassa
  • Yhdistämisen tyyppi on uusi tai olemassa
Taulukkotyyppi Yhdistämismääritystyyppi Käytettävissä olevat muutokset
Uusi taulukko Uusi yhdistämismääritys Nimeä sarake uudelleen, muuta tietotyyppiä, muuta tietolähdettä, yhdistämisen muunnos, lisää sarake, poista sarake
Aiemmin luotu taulukko Uusi yhdistämismääritys Lisää sarake (jonka tietotyyppiä voit sitten muuttaa, nimetä uudelleen ja päivittää)
Aiemmin luotu taulukko Aiemmin luotu yhdistäminen ei lainkaan

Näyttökuva sarakkeista, jotka ovat avoinna muokkausta varten.

Yhdistämismuunnokset

Jotkin tietomuotojen yhdistämismääritykset (Parquet, JSON ja Avro) tukevat yksinkertaisia käytönaikaisia muunnoksia. Jos haluat käyttää yhdistämismuunnoksia, luo tai päivitä sarake Muokkaa sarakkeita -ikkunassa.

Yhdistämisen muunnokset voidaan suorittaa saraketyypille merkkijono tai päivämäärä ja aika, jolloin lähteen tietotyyppi on int tai pitkä. Tuettuja yhdistämismääritysten muunnoksia ovat seuraavat:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Tietotyyppiin perustuvat lisäasetukset

Taulukkomuotoinen (CSV, TSV, PSV):

  • Jos käytät taulukkomuotoja aiemmin luodussa taulukon, voit valita Lisäasetukset>Säilytä taulukon rakenne. Taulukkomuotoiset tiedot eivät välttämättä sisällä sarakkeiden nimiä, joita käytetään lähdetietojen yhdistämiseen olemassa oleviin sarakkeisiin. Kun tämä asetus on valittuna, yhdistäminen tehdään järjestyksen mukaan ja taulukon rakenne pysyy samana. Jos asetuksen valinta ei ole valittu, uusia sarakkeita luodaan saapuville tiedoille tietorakenteesta riippumatta.

  • Jos haluat käyttää ensimmäistä riviä sarakkeiden niminä, valitse Lisäasetukset>Ensimmäinen rivi on sarakeotsikko.

    Näyttökuva CSV-lisäasetuksista.

JSON:

  • Voit selvittää JSON-tietojen sarakkeen jaon valitsemalla Lisäasetukset>sisäkkäisten tasojen1–100.

  • Jos valitset Lisäasetukset->Ohita JSON-rivit, joissa on virheitä, tiedot käsitellään JSON-muodossa. Jos jätät tämän valintaruudun valitsematta, tietoja käytetään multijson-muodossa.

    Näyttökuva JSON-lisäasetuksista.

Yhteenveto

Tietojen valmistelu -ikkunassa kaikki kolme vaihetta merkitään vihreillä tarkistusmerkeillä, kun tietojen käsittely onnistuu. Voit valita kortin kyselyä varten, pudottaa saadut tiedot tai tarkastella koontinäyttöä käsittelyyhteenvedostasi.

Näyttökuva yhteenvetosivusta, jossa onnistunut käsittely on valmis.