Dela via


Mata in data i ditt lager med hjälp av datapipelines

Gäller för:✅ Warehouse i Microsoft Fabric

Datapipelines är ett alternativ till att använda kommandot COPY via ett grafiskt användargränssnitt. En datapipeline är en logisk gruppering av aktiviteter som tillsammans utför en datainmatningsuppgift. Med pipelines kan du hantera aktiviteter för att extrahera, transformera och läsa in (ETL) i stället för att hantera var och en individuellt.

I den här självstudien skapar du en ny pipeline som läser in exempeldata till ett lager i Microsoft Fabric.

Kommentar

Vissa funktioner från Azure Data Factory är inte tillgängliga i Microsoft Fabric, men begreppen är utbytbara. Du kan lära dig mer om Azure Data Factory och pipelines på pipelines och aktiviteter i Azure Data Factory och Azure Synapse Analytics. En snabbstart finns i Snabbstart: Skapa din första pipeline för att kopiera data.

Skapa en datapipeline

  1. Om du vill skapa en ny pipeline navigerar du till din arbetsyta, väljer knappen +Ny och väljer Datapipeline. Skärmbild av det översta avsnittet på användarens arbetsyta som visar knappen Nytt och med alternativen Lager, Datapipeline och Visa alla.

  2. I dialogrutan Ny pipeline anger du ett namn för den nya pipelinen och väljer Skapa.

  3. Du hamnar i området pipelinearbetsyta där du ser tre alternativ för att komma igång: Lägga till en pipelineaktivitet, Kopiera data och Välj en uppgift att starta.

    Skärmbild som visar de tre alternativ som ska väljas för att starta inmatningen.

    Vart och ett av dessa alternativ erbjuder olika alternativ för att skapa en pipeline:

    • Lägg till pipelineaktivitet: Det här alternativet startar pipelineredigeraren, där du kan skapa nya pipelines från grunden med hjälp av pipelineaktiviteter.
    • Kopiera data: Det här alternativet startar en stegvis assistent som hjälper dig att välja en datakälla, ett mål och konfigurera datainläsningsalternativ som kolumnmappningar. När den är klar skapar den en ny pipelineaktivitet med en kopieringsdataaktivitet som redan har konfigurerats åt dig.
    • Välj en uppgift att starta: Det här alternativet startar en uppsättning fördefinierade mallar som hjälper dig att komma igång med pipelines baserat på olika scenarier.

    Välj alternativet Kopiera data för att starta kopieringsassistenten.

  4. Den första sidan i kopieringsdataassistenten hjälper dig att välja dina egna data från olika datakällor, eller välja från ett av de angivna exemplen för att komma igång. I den här självstudien använder vi COVID-19 Data Lake-exemplet . Välj det här alternativet och välj Nästa.

    Skärmbild som visar alternativ för att använda exempeldata eller andra datakällor.

  5. På nästa sida kan du välja en datauppsättning, källfilformatet och förhandsgranska den valda datauppsättningen. Välj Bing COVID-19, CSV-format och välj Nästa.

    Skärmbild som visar olika datauppsättningsalternativ för COVID-19-exemplet, filformat och ett rutnät som visar en förhandsgranskning av data.

  6. På nästa sida, Datamål, kan du konfigurera typen av målarbetsyta. Vi läser in data till ett lager på vår arbetsyta, så välj fliken Lager och alternativet Informationslager . Välj Nästa.

    Skärmbild som visar olika målalternativ.

  7. Nu är det dags att välja det lager som data ska läsas in i. Välj önskat lager i listrutan och välj Nästa.

    Skärmbild som visar en listruta med ett lager valt.

  8. Det sista steget för att konfigurera målet är att ange ett namn på måltabellen och konfigurera kolumnmappningarna. Här kan du välja att läsa in data till en ny tabell eller till en befintlig tabell, ange ett schema och tabellnamn, ändra kolumnnamn, ta bort kolumner eller ändra deras mappningar. Du kan acceptera standardinställningarna eller justera inställningarna efter dina önskemål.

    Skärmbild som visar alternativen för att läsa in data till en befintlig tabell eller skapa en ny.

    När du är klar med att granska alternativen väljer du Nästa.

  9. På nästa sida får du möjlighet att använda mellanlagring eller tillhandahålla avancerade alternativ för datakopieringsåtgärden (som använder T-SQL COPY-kommandot). Granska alternativen utan att ändra dem och välj Nästa.

  10. Den sista sidan i assistenten innehåller en sammanfattning av kopieringsaktiviteten. Välj alternativet Starta dataöverföring omedelbart och välj Spara + Kör.

    Skärmbild som visar alternativet att starta dataöverföringsåtgärden omedelbart och knapparna Tillbaka och Spara + Kör.

  11. Du dirigeras till området för pipelinearbetsytan, där en ny kopieringsdataaktivitet redan har konfigurerats åt dig. Pipelinen börjar köras automatiskt. Du kan övervaka statusen för din pipeline i fönstret Utdata :

    Skärmbild som visar pipelinearbetsytan med en aktiviteten Kopiera i mitten och pipelinekörningsstatusen som visar aktuell status Pågår.

  12. Efter några sekunder slutförs pipelinen. Om du går tillbaka till ditt lager kan du välja tabellen för att förhandsgranska data och bekräfta att kopieringsåtgärden har slutförts.

    Skärmbild som visar ett lager med den bing_covid_19 tabellen markerad och ett rutnät som visar en förhandsgranskning av data i tabellen.

Mer information om datainmatning i ditt lager i Microsoft Fabric finns i:

Gå vidare