Hvad er kopijobbet (prøveversion) i Data Factory til Microsoft Fabric
Data Factory i Fabric giver brugerne mulighed for problemfrit at integrere data fra mere end 100 indbyggede connectors – både kilder og destinationer – via en visuelt intuitiv grænseflade. Kopieringsaktiviteten, der arbejder i datapipelines, letter dataindtagelse. I mellemtiden understøtter Dataflow Gen2 datatransformationer, og pipelines organiserer integrationsflowet.
Fordele ved kopijobbet
Selvom kopieringsaktiviteten i datapipelines håndterer dataindtagelse med masse-/batchhandlinger, viser oprettelsen af datapipelines i Data Factory sig stadig at være en udfordring for mange brugere, der ikke kender til området, med en mere stejl læringskurve. Så vi er glade for at kunne introducere kopijobbet, der hæver dataindtagelsesoplevelsen til en mere strømlinet og brugervenlig proces fra enhver kilde til en hvilken som helst destination. Det er nu nemmere end nogensinde før at kopiere dine data. Kopieringsjobbet understøtter desuden forskellige dataleveringstypografier, herunder både batchkopi og trinvis kopi, der giver fleksibilitet til at imødekomme dine specifikke behov.
Nogle af fordelene ved kopijobbet i forhold til andre metoder til dataflytning omfatter:
- Intuitiv oplevelse: Oplev problemfri kopiering af data uden kompromiser, hvilket gør det nemmere end nogensinde før.
- Effektivitet: Aktivér trinvis kopiering uden besvær, hvilket reducerer manuel indgriben. Denne effektivitet betyder mindre ressourceudnyttelse og hurtigere kopieringsvarighed.
- Fleksibilitet: Mens du nyder enkeltheden, har du også fleksibiliteten til at styre din databevægelse. Vælg, hvilke tabeller og kolonner der skal kopieres, knyt dataene, definer læse-/skrivefunktionsmåden, og angiv tidsplaner, der passer til dine behov, uanset om det er en engangsopgave eller tilbagevendende handling.
- Robust ydeevne: En serveruafhængig konfiguration, der muliggør dataoverførsel med storstilet parallelitet, hvilket maksimerer dataflytningsoverførselshastigheden for dit system.
Understøttede connectors
I øjeblikket kan du bruge kopijobbet til overførsel af clouddata eller kopiering af data fra et datalager i det lokale miljø via gatewayen. Kopijobbet understøtter følgende datalagre som både kilde og destination:
- Azure SQL DB
- SQL Server i det lokale miljø
- Fabric Warehouse
- Fabric Lakehouse
- Amazon S3
- Azure Data Lake Storage Gen2
- Azure Blob Storage
- Amazon RDS til SQL Server
Produktteamet udforsker yderligere connectorsupport, så hold dig opdateret om opdateringer.
Funktionsmåde for kopiering
Du kan vælge mellem følgende dataleveringstypografier.
- Fuld kopieringstilstand: Hvert kopijob, der køres, kopierer alle data fra kilden til destinationen på én gang.
- Trinvis kopieringstilstand: Det indledende job, der køres, kopierer alle data, og efterfølgende job kører kun kopiering af ændringer siden sidste kørsel. De ændrede data føjes til destinationslageret.
Du kan også vælge, hvordan data skal skrives til din destinationsbutik.
Kopiér job føjer som standard data til destinationen, så du ikke går glip af nogen ændringsoversigt. Men du kan også justere skrivefunktionsmåden for at upsert eller overskrive.
- Når du kopierer data til lagerlageret: Nye rækker fra tabellerne eller filerne kopieres til nye filer i destinationen. Hvis der allerede findes en fil med samme navn i destinationslageret, overskrives den.
- Når du kopierer data til databasen: Nye rækker fra tabellerne eller filerne føjes til destinationstabeller. Du kan ændre skrivefunktionsmåden til upsert (på SQL DB eller SQL Server) eller overskrive (i Fabric Lakehouse-tabeller).
Trinvis kolonne
I tilstanden Trinvis kopiering skal du vælge en trinvis kolonne for hver tabel for at identificere ændringer. Kopiér job bruger denne kolonne som et vandmærke og sammenligner dens værdi med det samme fra sidste kørsel for kun at kopiere de nye eller opdaterede data. Den trinvise kolonne skal være et tidsstempel eller en stigende INT.
Regiontilgængelighed
Kopijobbet har samme regionale tilgængelighed som pipelinen.
Prisfastsættelse
Kopijobbet bruger den samme faktureringsmåler: Dataflytning med en identisk forbrugshastighed.