Självstudiekurs i Lakehouse: Importera data till lakehouse

Artikel
03/22/2025

I den här handledningen matar du in fler dimensions- och faktatabeller från Wide World Importers (WWI) in i lakehouse.

Förutsättningar

Om du inte har ett sjöhus måste du skapa ett sjöhus.

Mata in data

I det här avsnittet använder du Kopiera data-aktiviteten i Data Factory-pipelinen för att mata in exempeldata från ett Azure-lagringskonto till Filer-avsnittet i lakehouse som du skapade tidigare.

Välj Arbetsytor i det vänstra navigeringsfönstret och välj sedan din nya arbetsyta på menyn Arbetsytor . Objektvyn för arbetsytan visas.
I alternativet Nytt objekt i arbetsytans menyfliksområde väljer du Datapipeline.
I dialogrutan Ny pipeline anger du namnet som IngestDataFromSourceToLakehouse och väljer Skapa. En ny datafabrikspipeline skapas och öppnas.
Konfigurera sedan en HTTP-anslutning för att importera exempeldata från World Wide Importers till Lakehouse. I listan med Nya källor väljer du Visa mer, söker efter Http och väljer den.

I fönstret Anslut till datakälla anger du informationen i tabellen nedan och väljer Nästa.

Egendom	Värde
webbadress	`https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip`
Anslutning	Skapa en ny anslutning
Anslutningens namn	wwisampledata
Datagateway	Ingen
Typ av autentisering	Anonym

Skärmbild som visar parametrarna för att konfigurera Http-anslutningen.

I nästa steg aktiverar du den binära kopian och väljer ZipDeflate (.zip) som komprimeringstyp eftersom källan är en .zip fil. Behåll de andra fälten som standardvärden och välj Nästa.
I fönstret Anslut till datamål anger du Rotmappen som Filer och väljer Nästa. Detta kommer att skriva data till avsnittet Filer i lakehouse.
Välj Nästa, målfilformatet anges automatiskt till Binary. Välj sedan Spara+Kör. Du kan schemalägga pipelines för att uppdatera data med jämna mellanrum. I den här handledningen kör vi bara pipelinen en gång. Datakopieringsprocessen tar cirka 10–15 minuter att slutföra.
Du kan övervaka pipelinekörningen och aktiviteten på fliken Utdata . Du kan också visa detaljerad information om dataöverföring genom att välja glasögonikonen bredvid pipelinenamnet, som visas när du hovrar över namnet.
När pipelinen har körts går du till lakehouse (wwilakehouse) och öppnar utforskaren för att se importerade data.
Kontrollera att mappen WideWorldImportersDW finns i Utforskarvyn och innehåller data för alla tabeller.
Data skapas under avsnittet Filer i Lakehouse Explorer. En ny mapp med GUID innehåller alla data som behövs. Byt namn på GUID till wwi-raw-data