Overføre data og datasamlebånd fra Azure Synapse Analytics til Microsoft Fabric
Det første trinnet i data- og datasamlebåndoverføring er å identifisere dataene du vil gjøre tilgjengelig i OneLake, og datasamlebåndene du har tenkt å flytte.
Du har to alternativer for dataoverføring:
- Alternativ 1: Azure Data Lake Storage (ADLS) Gen2 som standard lagringsplass. Hvis du for øyeblikket bruker ADLS Gen2 og vil unngå datakopiering, kan du vurdere å bruke OneLake-snarveier.
- Alternativ 2: OneLake som standard lagringsplass. Hvis du vil flytte fra ADLS Gen2 til OneLake som et lagringslag, kan du vurdere å lese/skrive fra/til OneLake fra notatblokkene og Spark-jobbdefinisjonene.
Dataoverføring
Alternativ 1: ADLS Gen2 som lagringsplass (snarveier)
Hvis du samhandler med ADLS Gen2 og vil unngå dataduplisering, kan du opprette en snarvei til ADLS Gen2-kildebanen i OneLake. Du kan opprette snarveier i filer og tabeller i lakehouse i Fabric med følgende hensyn:
- Filer-delen er det uadministrerte området i innsjøen. Hvis dataene er i CSV-, JSON- eller Parquet-format, anbefaler vi at du oppretter en snarvei til dette området.
- Tabeller-delen er det forvaltede området i innsjøen. Alle tabeller, både Spark-administrerte og uadministrerte tabeller, er registrert her. Hvis dataene er i Delta-format, kan du opprette en snarvei i dette området, og den automatiske oppdagelsesprosessen registrerer automatisk disse Delta-tabellene i metalageret i lakehouse.
Mer informasjon på å opprette en Snarvei for ADLS Gen2.
Alternativ 2: OneLake som lagringsplass
Hvis du vil bruke OneLake som et lagringslag og flytte data fra ADLS Gen2, bør du i utgangspunktet peke Azure Synapse Spark-relaterte elementer til OneLake og deretter overføre eksisterende data til OneLake. For førstnevnte kan du se integrere OneLake med Azure Synapse Spark.
Hvis du vil flytte eksisterende data til OneLake, har du flere alternativer:
- mssparkutils fastcp: Mssparkutils-biblioteket gir en fastcp API som gjør det mulig å kopiere data mellom fra ADLS Gen2 til OneLake.
- AzCopy: Du kan bruke kommandolinjeverktøyet AzCopy til å kopiere data fra ADLS Gen2 til OneLake.
- Azure Data Factory, Azure Synapse Analytics og Data Factory in Fabric: Bruk kopieringsaktivitet til å kopiere data til lakehouse.
- Bruk snarveier: Du kan aktivere ADLS Gen2 historiske data i OneLake ved hjelp av snarveier. Ingen datakopi er nødvendig.
- Azure Storage Explorer: Du kan flytte filer fra ADLS Gen2-plassering til OneLake ved hjelp av Azure Storage Explorer. Se hvordan du integrerer OneLake med Azure Storage Explorer.
Overføring av datasamlebånd (Spark-relaterte aktiviteter)
Hvis Azure Synapse-datasamlebånd inkluderer notatblokk- og/eller Spark-jobbdefinisjonsaktiviteter, må du flytte disse datasamlebåndene fra Azure Synapse til Data Factory-datasamlebånd i Fabric, og referere til målnotatblokkene. Notatblokkaktiviteten er tilgjengelig i datasamlebånd fra Data Factory. Se alle støttede datasamlebåndaktiviteter i Fabric her.
- Se forskjeller mellom Azure Synapse Spark og Fabric for spark-relaterte dataforløpsaktivitetshensyn.
- For notatblokkoverføring kan du se overføre notatblokker fra Azure Synapse til Fabric.
- Hvis du vil ha datasamlebåndoverføring, kan du se overføre til Data Factory i Fabric.