Jaa


Lakehouse-opetusohjelma: Tietojen käyttö Lakehousessa

Tässä opetusohjelmassa käsitellään dimensio- ja faktataulukoita Wide World Importers (WWI) -taulukoista lakehouse-järjestelmään.

Edellytykset

Tietojen käsitteleminen

Tässä osiossa käytät Data Factory -putken Kopioi tiedot -toimintoa mallitietojen käyttämiseen Azure-tallennustililtä aiemmin luomasi Lakehousen Tiedostot-osioon .

  1. Valitse vasemmanpuoleisesta siirtymisruudusta Työtilat ja valitse sitten uusi työtilaSi Työtilat-valikosta. Työtilasi kohteiden näkymä avautuu.

  2. Valitse työtilan valintanauhan +Uusi-valikkovaihtoehdosta Tietoputki.

    Näyttökuva, jossa näytetään, miten voit luoda uuden tietoputken.

  3. Määritä Uusi putki -valintaikkunassa nimeksi IngestDataFromSourceToLakehouse ja valitse Luo. Uusi tietotehdasputki luodaan ja avataan.

  4. Määritä seuraavaksi HTTP-yhteys, joka tuo Maailmanlaajuisten tuojien mallitiedot Lakehouseen. Valitse Uusien lähteiden luettelosta Näytä lisää, etsi Http ja valitse se.

    Näyttökuva, jossa näkyy HTTP-lähteen valintapaikka.

  5. Anna Yhdistä tietolähteeseen -ikkunassa tiedot alla olevasta taulukosta ja valitse Seuraava.

    Ominaisuus Value
    URL-osoite https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
    Connection Uuden yhteyden luominen
    Yhteyden nimi wwisampledata
    Tietoyhdyskäytävä Ei ole
    Todennuslaji Anonyymi

    Näyttökuva, jossa näkyvät Http-yhteyden määrittämiseen liittyvät parametrit.

  6. Ota seuraavassa vaiheessa binaarikopio käyttöön ja valitse Pakkaus-tyypiksi ZipDeflate (.zip), koska lähde on .zip tiedosto. Säilytä muut kentät niiden oletusarvoissa ja valitse Seuraava.

    Näyttökuva, jossa näytetään, miten voit valita pakkaustyypin.

  7. Määritä Yhdistä tietokohteeseen -ikkunassa juurikansio nimellä Tiedostot ja valitse Seuraava. Tämä kirjoittaa tiedot Lakehousen Tiedostot-osioon .

    Näyttökuva, jossa näkyvät Lakehousen kohdeyhteysasetukset.

  8. Valitse kohteen Tiedosto-muoto binaarimuodoksi. Valitse Seuraava ja sitten Tallenna+ Suorita. Voit ajoittaa jaksoja tietojen päivittämiseksi säännöllisin väliajoin. Tässä opetusohjelmassa putki suoritetaan vain kerran. Tietojen kopiointiprosessin suorittaminen kestää noin 10–15 minuuttia.

    Näyttökuvassa näkyy kohdetiedoston muoto.

  9. Voit seurata putken suorittamista ja toimintaa Tuloste-välilehdessä . Voit myös tarkastella yksityiskohtaisia tiedonsiirtotietoja valitsemalla putken nimen vieressä olevan lasikuvakkeen, joka tulee näkyviin, kun viet hiiren osoittimen nimen päälle.

    Näyttökuva, jossa näkyy kopiointiputken toiminnan tila.

  10. Kun putki on käsitelty onnistuneesti, siirry lakehouse-tilaan (wwilakehouse) ja avaa resurssienhallinta tuotujen tietojen näkemistä varten.

    Näyttökuva, jossa näytetään, miten voit siirtyä Lakehouse-talolle.

  11. Varmista, että WideWorldImportersDW-kansio on explorer-näkymässä ja että se sisältää kaikkien taulukoiden tiedot.

    Näyttökuva, jossa lähdetiedot on kopioitu Lakehouse Exploreriin.

  12. Tiedot luodaan Lakehouse Explorerin Tiedostot-osiossa . Uusi GUID-tunnuksen sisältävä kansio sisältää kaikki tarvittavat tiedot. Nimeä GUID uudelleen nimellä wwi-raw-data

Jos haluat ladata lisääviä tietoja lakehouseen, katso Lisäävästi ladatut tiedot tietovarastosta lakehouseen.

Seuraava vaihe