Jaa


Moduuli 1: Putken luominen Data Factoryn avulla

Tämä moduuli vie 10 minuuttia ja saa raakatiedot lähdesäilöstä Lakehouse-tietojärven pronssitaulukkoon käyttämällä putken Kopioi toiminto -toimintoa.

Moduulin 1 ylätason vaiheet ovat seuraavat:

  1. Luo tietoputki.
  2. Käytä putken kopiointitoimintoa mallitietojen lataamiseen Lakehouse-datavarastoon.

Tietoputken luominen

  1. Microsoft Fabric -vuokraajatili, jolla on aktiivinen tilaus, vaaditaan. Luo ilmainen tili.

  2. Varmista, että sinulla on Microsoft Fabric -työtila: Luo työtila.

  3. Kirjaudu sisään Power BI:hin.

  4. Valitse oletusarvoinen Power BI -kuvake näytön vasemmasta alakulmasta ja siirry Data Factory -käyttökokemukseen.

    Screenshot showing the selection of the Data Factory experience.

  5. Valitse Tietoputki ja anna putken nimi. Valitse sitten Luo.

    Screenshot of the Data Factory start page with the button to create a new data pipeline selected.

    Screenshot showing the dialog to give the new pipeline a name.

Mallitietojen lataaminen Lakehouse-tietolähteeseen putken Kopioi toiminto -toiminnolla

Vaihe 1: Kopioi aktiviteetti kopiointiavustajan avulla.

Avaa kopioavustajatyökalu valitsemalla Kopioi tiedot .

Screenshot showing the selection of the Copy data activity from the new pipeline start page.

Vaihe 2: Määritä asetukset kopioavustajassa.

  1. Tietojen kopioiminen -valintaikkunassa näkyy ensimmäinen vaihe, Valitse tietolähde, korostettuna. Vieritä tarvittaessa alaspäin Tietolähteet-osioon ja valitse Azure Blob Tallennus -tietolähdetyyppi. Valitse sitten Seuraava.

    Screenshot showing the selection of the Azure Blob Storage data source type in the copy assistant on the Choose data source tab.

  2. Valitse seuraavassa vaiheessa Luo uusi yhteys ja anna url-osoite blob-säilöön, joka isännöi tässä opetusohjelmassa annettuja mallitietoja, osoitteessa https://nyctaxisample.blob.core.windows.net/sample. Todennuslaji on anonyymi. Valitse Seuraava URL-osoitteen antamisen jälkeen.

    Screenshot showing the creation of a new Azure Blob Storage connection with the URL for the sample data in the tutorial.

  3. Näkyviin tulee Näyttöyhteys tietolähteeseen -vaihe. Näet aluksi virheen Tiedostojen luetteloa ei voi luetella, koska käyttöoikeudet on myönnetty vain blob-säilön mallikansiolle. Anna kansion nimi, malli ja valitse Yritä uudelleen.

    Screenshot showing the Unable to list files error with the folder name Sample provided.

    Muistiinpano

    Blob-säilökansiossa kirjainkoko on merkitsevä, ja sen tulee olla pienissä kirjaimissa.

  4. Blob-säilöselain tulee näkyviin seuraavaksi. Valitse NYC-Taxi-Green-2015-01.parquet-tiedosto ja odota, kunnes tietojen esikatselu tulee näkyviin. Valitse sitten Seuraava.

    Screenshot showing the preview data for the NYC-Taxi-Green-2015-01.parquet file.

  5. Valitse kopiointiavustajan Valitse tietokohde -vaiheessa Lakehouse ja sitten Seuraava.

    Screenshot showing the selection of the Lakehouse destination on the Choose data destination tab of the Copy data assistant.

  6. Valitse avautuvalta tietokohteen määrityssivulta Luo uusi Lakehouse ja anna uudelle Lakehouselle nimi. Valitse sitten uudelleen Seuraava .

    Screenshot showing the data destination configuration page of the Copy assistant, choosing the Create new Lakehouse option and providing a Lakehouse name.

  7. Määritä nyt Lakehouse-kohteen tiedot Valitse ja yhdistä kansiopolkuun tai taulukkoon -sivulla. Valitse Pääkansio-kansiolle Taulukot, anna taulukon nimi ja valitse Korvaa-toiminto. Älä valitse Ota osio käyttöön -valintaruutua, joka tulee näkyviin, kun olet valinnut Korvaa taulukko -toiminnon.

    Screenshot showing the Connect to data destination tab of the Copy data assistant, on the Select and map to folder path or table step.

  8. Tarkista lopuksi määritys kopioavustajan Tarkistamisen ja tallentamisen sivulla. Poista tässä opetusohjelmassa Käynnistä tiedonsiirto välittömästi -valintaruudun valinta, sillä toiminto suoritetaan manuaalisesti seuraavassa vaiheessa. Valitse sitten OK.

    Screenshot showing the Copy data assistant on the Review + save page.

Vaihe 3: Suorita ja tarkastele Kopioi aktiviteettisi tuloksia.

  1. Valitse putkieditorin Suorita-välilehti . Valitse sitten Suorita-painike ja suorita sitten Tallenna ja suorita kehotteessa Kopioi aktiviteetti.

    Screenshot showing the pipeline Run tab with the Run button highlighted.

    Screenshot showing the Save and run dialog with the Save and run button highlighted.

  2. Voit seurata suoritusta ja tarkistaa tulokset putken piirtoalustan alla olevasta Tuloste-välilehdestä . Valitse Suoritustiedot-painike (lasit-kuvake, joka tulee näkyviin, kun viet hiiren osoittimen käynnissä olevan jakson päälle) tarkastellaksesi suorituksen tietoja.

    Screenshot showing the run details button in the pipeline Output tab.

  3. Suoritustiedoissa näkyy 1 508 501 riviä luettuna ja kirjoitettuna.

    Screenshot of the Copy data details for the pipeline run.

  4. Laajenna Keston erittely -osiota, jotta näet Kopioi aktiviteetti -toiminnon kunkin vaiheen keston. Kun olet tarkistanut kopion tiedot, valitse Sulje.

    Screenshot showing the duration breakdown of the Copy activity run.

Tässä ensimmäisessä moduulissa, joka opasti päästä päähän -opetusohjelmaan tietojen integroinnista Data Factoryn avulla Microsoft Fabricissa, opit

  • Luo tietoputki.
  • Lisää Kopioi aktiviteetti jaksoon.
  • Käytä mallitietoja ja luo data Lakehouse-tieto, jotta voit tallentaa tiedot uuteen taulukkoon.
  • Suorita putki ja tarkastele sen tietoja ja keston erittelyä.

Luo tietovuo jatkamalla seuraavaan osioon.