Indfødning af data i dit lager ved hjælp af datapipelines
Gælder for:✅ Warehouse i Microsoft Fabric
Datapipelines er et alternativ til at bruge kommandoen COPY via en grafisk brugergrænseflade. En datapipeline er en logisk gruppering af aktiviteter, der tilsammen udfører en dataindtagelsesopgave. Pipelines giver dig mulighed for at administrere etl-aktiviteter (extract, transform and load) i stedet for at administrere hver enkelt.
I dette selvstudium skal du oprette en ny pipeline, der indlæser eksempeldata i et lager i Microsoft Fabric.
Bemærk
Nogle funktioner fra Azure Data Factory er ikke tilgængelige i Microsoft Fabric, men koncepterne er udskiftelige. Du kan få mere at vide om Azure Data Factory og Pipelines på Pipelines og aktiviteter i Azure Data Factory og Azure Synapse Analytics. Du kan få en hurtig introduktion ved at gå til Hurtig start: Opret din første pipeline for at kopiere data.
Opret en datapipeline
Hvis du vil oprette en ny pipeline, skal du navigere til dit arbejdsområde ved at vælge knappen +Ny og vælge Datapipeline.
Hvis du vil oprette en ny pipeline, skal du vælge knappen + Nyt element og vælge Datapipeline.
- Vælg
+ Nyt element i dit arbejdsområde, og søg efter kortetdatapipeline i afsnittet Hent data . - Eller vælg Opret i navigationsruden. Se efter kortet
datapipeline i afsnittet Data Factory.
- Vælg
I dialogboksen Ny pipeline skal du angive et navn til din nye pipeline og vælge Opret.
Du lander i pipelinelærredet, hvor du kan se muligheder for at komme i gang.
Vælg indstillingen Kopiér dataassistent for at starte Kopiér-assistent.
Den første side i Kopiér dataassistent hjælper dig med at vælge dine egne data fra forskellige datakilder eller vælge mellem et af de angivne eksempler for at komme i gang. Vælg Eksempeldata på menulinjen på denne side. I dette selvstudium bruger vi COVID-19 Data Lake-eksemplet . Vælg denne indstilling, og vælg Næste.
På den næste side kan du vælge et datasæt, kildefilformatet og få vist det valgte datasæt. Vælg Bing COVID-19, CSV-formatet , og vælg Næste.
På den næste side, Datadestinationer, kan du konfigurere destinationsarbejdsområdets type. Vi indlæser data i et lager i vores arbejdsområde. Vælg det ønskede lager på rullelisten, og vælg Næste.
Det sidste trin til at konfigurere destinationen er at angive et navn til destinationstabellen og konfigurere kolonnetilknytningerne. Her kan du vælge at indlæse dataene i en ny eller eksisterende tabel, angive et skema og tabelnavne, ændre kolonnenavne, fjerne kolonner eller ændre deres tilknytninger. Du kan acceptere standarderne eller justere indstillingerne efter dine præferencer.
Når du er færdig med at gennemse indstillingerne, skal du vælge Næste.
På den næste side kan du bruge midlertidigeller angive avancerede indstillinger for datakopieringshandlingen (som bruger kommandoen T-SQL COPY). Gennemse indstillingerne uden at ændre dem, og vælg Næste.
Den sidste side i assistenten indeholder en oversigt over kopiaktiviteten. Vælg indstillingen Start dataoverførsel med det samme , og vælg Gem + Kør.
Du omdirigeres til pipelinelærredet, hvor der allerede er konfigureret en ny kopidataaktivitet for dig. Pipelinen begynder at køre automatisk. Du kan overvåge status for pipelinen i ruden Output :
Efter et par sekunder afsluttes pipelinen. Når du navigerer tilbage til lageret, kan du vælge din tabel for at få vist dataene og bekræfte, at kopieringen blev afsluttet.
Du kan finde flere oplysninger om dataindtagelse i dit lager i Microsoft Fabric ved at besøge:
- Indtagelse af data i lageret
- Indfødning af data i lageret ved hjælp af COPY-sætningen
- Indfødning af data i dit lager ved hjælp af Transact-SQL