Hva er kopieringsjobben (forhåndsvisning) i Data Factory for Microsoft Fabric
Data Factory in Fabric gjør det mulig for brukere å sømløst integrere data fra over 100 innebygde koblinger – både kilder og destinasjoner – gjennom et visuelt intuitivt grensesnitt. Kopier-aktiviteten, som arbeider i datasamlebånd, forenkler datainntaket. I mellomtiden støtter Dataflyt Gen2 datatransformasjoner, og datasamlebånd orkestrerer integreringsflyten.
Fordeler med Kopier-jobben
Selv om Kopier-aktiviteten i datasamlebånd håndterer datainntak med masse-/satsvise operasjoner, viser oppretting av datasamlebånd i Data Factory fortsatt utfordrende for mange brukere som er nye i feltet, med en brattere læringskurve. Så vi er glade for å introdusere Kopier-jobben, noe som øker datainntaksopplevelsen til en mer strømlinjeformet og brukervennlig prosess fra enhver kilde til et hvilket som helst mål. Nå er det enklere enn noen gang å kopiere dataene dine. Kopier jobb støtter dessuten ulike dataleveringsstiler, inkludert både partikopi og trinnvis kopi, og gir fleksibilitet til å dekke dine spesifikke behov.
Noen fordeler med kopieringsjobben i forhold til andre metoder for dataflytting inkluderer:
- Intuitiv opplevelse: Opplev sømløs datakopiering uten kompromisser, noe som gjør det enklere enn noensinne.
- Effektivitet: Aktiver trinnvis kopiering enkelt, og reduser manuell inngripen. Denne effektiviteten oversettes til mindre ressursutnyttelse og raskere kopieringsvarigheter.
- Fleksibilitet: Samtidig som du nyter enkelheten, har du også fleksibiliteten til å kontrollere databevegelsen. Velg hvilke tabeller og kolonner som skal kopieres, tilordne dataene, definer virkemåte for lese/skriving, og angi tidsplaner som passer dine behov, enten det gjelder en engangsoppgave eller regelmessig operasjon.
- Robust ytelse: Et serverløst oppsett som muliggjør dataoverføring med storstilt parallellitet, som maksimerer gjennomstrømming av databevegelser for systemet.
Støttede koblinger
For øyeblikket kan du bruke kopieringsjobben for skydataoverføring eller kopiering av data fra et lokalt datalager via gateway. Kopier-jobben støtter følgende datalagre som både kilde og mål:
- Azure SQL-databasen
- Lokal SQL Server
- Fabric Warehouse
- Fabric Lakehouse
- Amazon S3
- Azure Data Lake Storage Gen2
- Azure Blob-lagring
- Amazon RDS for SQL Server
Produktteamet utforsker ytterligere koblingsstøtte, så følg med for oppdateringer.
Kopier virkemåte
Du kan velge blant følgende dataleveringsstiler.
- Fullstendig kopieringsmodus: Hver kopieringsjobb kjører kopierer alle data fra kilden til målet samtidig.
- Trinnvis kopieringsmodus: Den første jobbkjøringen kopierer alle data, og etterfølgende jobbkjøringer kopieres bare endringer siden forrige kjøring. De endrede dataene legges til i mållageret.
Du kan også velge hvordan data skal skrives til mållageret.
Kopier jobb tilføyer som standard data til målet, slik at du ikke går glipp av noen endringslogg . Du kan imidlertid også justere skrivevirkemåten til å oppsert eller overskrive.
- Når du kopierer data til lagringslageret: Nye rader fra tabellene eller filene kopieres til nye filer i målet. Hvis det allerede finnes en fil med samme navn i mållageret, overskrives den.
- Når du kopierer data til databasen: Nye rader fra tabellene eller filene legges til måltabeller. Du kan endre skrivemåten til upsert (på SQL DB eller SQL Server) eller overskrive (på Fabric Lakehouse-tabeller).
Trinnvis kolonne
I trinnvis kopieringsmodus må du velge en trinnvis kolonne for hver tabell for å identifisere endringer. Kopier jobb bruker denne kolonnen som et vannmerke, og sammenligner verdien med den samme fra siste kjøring for å kopiere bare de nye eller oppdaterte dataene. Den trinnvise kolonnen må være et tidsstempel eller en økende INT.
Regional tilgjengelighet
Kopier-jobben har samme regionale tilgjengelighet som datasamlebåndet.
Prissetting
Kopier-jobben bruker samme faktureringsmåler: Dataflytting, med en identisk forbrukssats.