Del via


Lakehouse-selvstudium: Indfødning af data i lakehouse

I dette selvstudium indfødning du mere dimensionelle og fakta tabeller fra Wide World Importers (WWI) i lakehouse.

Forudsætninger

Indtag data

I dette afsnit skal du bruge kopiér dataaktiviteten for Data Factory-pipelinen til at indtage eksempeldata fra en Azure Storage-konto til afsnittet Filer i det lakehouse, du oprettede tidligere.

  1. Vælg Arbejdsområder i navigationsruden til venstre, og vælg derefter dit nye arbejdsområde i menuen Arbejdsområder . Elementvisningen for arbejdsområdet vises.

  2. Vælg Datapipeline i menupunktet +Nyt på båndet i arbejdsområdet.

    Skærmbillede, der viser, hvordan du opretter en ny datapipeline.

  3. I dialogboksen Ny pipeline skal du angive navnet som IngestDataFromSourceToLakehouse og vælge Opret. Der oprettes og åbnes en ny datafabrikspipeline.

  4. Derefter skal du konfigurere en HTTP-forbindelse for at importere world wide importers-eksempeldataene til Lakehouse. Vælg Vis mere på listen over nye kilder, søg efter Http, og vælg den.

    Skærmbillede, der viser, hvor HTTP-kilden skal vælges.

  5. I vinduet Opret forbindelse til datakilde skal du angive detaljerne fra tabellen nedenfor og vælge Næste.

    Egenskab Værdi
    URL-adresse https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
    Connection Opret en ny forbindelse
    Forbindelsesnavn wwisampledata
    Datagateway Ingen
    Godkendelsestype Anonym

    Skærmbillede, der viser parametrene til konfiguration af Http-forbindelsen.

  6. I næste trin skal du aktivere den binære kopi og vælge ZipDeflate (.zip) som komprimeringstype , da kilden er en .zip fil. Bevar de andre felter ved deres standardværdier, og klik på Næste.

    Skærmbillede, der viser, hvordan du vælger en komprimeringstype.

  7. I vinduet Opret forbindelse til datadestination skal du angive mappen Rod som Filer og klikke på Næste. Dette skriver dataene til afsnittet Filer i lakehouse.

    Skærmbillede, der viser indstillingerne for destinationsforbindelsen for lakehouse.

  8. Vælg filformatet som binær for destinationen. Klik på Næste og derefter Gem+Kør. Du kan planlægge pipelines for at opdatere data med jævne mellemrum. I dette selvstudium kører vi kun pipelinen én gang. Datakopiprocessen tager ca. 10-15 minutter at fuldføre.

    Skærmbillede, der viser destinationsfilformatet.

  9. Du kan overvåge udførelsen af pipelinen og aktiviteten under fanen Output . Du kan også få vist detaljerede dataoverførselsoplysninger ved at vælge ikonet briller ud for pipelinenavnet, som vises, når du holder markøren over navnet.

    Skærmbillede, der viser status for kopipipelineaktiviteten.

  10. Når pipelinen er blevet udført, skal du gå til dit lakehouse (wwilakehouse) og åbne stifinderen for at se de importerede data.

    Skærmbillede, der viser, hvordan du navigerer til lakehouse.

  11. Kontrollér, at mappen WideWorldImportersDW findes i Stifinder-visningen og indeholder data for alle tabeller.

    Skærmbillede, der viser, at kildedataene kopieres til Stifinder i Lakehouse.

  12. Dataene oprettes under afsnittet Filer i lakehouse Explorer. En ny mappe med GUID indeholder alle de nødvendige data. Omdøb GUID'et til wwi-raw-data

Hvis du vil indlæse trinvise data i et lakehouse, skal du se Indlæs data trinvist fra et data warehouse til et lakehouse.

Næste trin