Del via


Overfør data og pipelines fra Azure Synapse Analytics til Microsoft Fabric

Det første trin i data- og pipelineoverførsel er at identificere de data, du vil gøre tilgængelige i OneLake, og de pipelines, du vil flytte.

Du har to muligheder for dataoverførsel:

  • Mulighed 1: Azure Data Lake Storage (ADLS) Gen2 som standardlager. Hvis du i øjeblikket bruger ADLS Gen2 og vil undgå kopiering af data, kan du overveje at bruge OneLake-genveje.
  • Mulighed 2: OneLake som standardlager. Hvis du vil flytte fra ADLS Gen2 til OneLake som et lagerlag, kan du overveje at læse/skrive fra/til OneLake fra dine notesbøger og Spark-jobdefinitioner.

Dataoverførsel

Mulighed 1: ADLS Gen2 som lager (genveje)

Hvis du interagerer med ADLS Gen2 og vil undgå duplikering af data, kan du oprette en genvej til ADLS Gen2-kildestien i OneLake. Du kan oprette genveje i sektionerne Filer og tabeller i lakehouse i Fabric med følgende overvejelser:

  • Afsnittet Filer er det ikke-administrerede område af søen. Hvis dine data er i CSV-, JSON- eller Parquet-format, anbefaler vi, at du opretter en genvej til dette område.
  • Afsnittet Tabeller er det administrerede område af søen. Alle tabeller, både Spark-administrerede og ikke-administrerede tabeller, registreres her. Hvis dine data er i Delta-format, kan du oprette en genvej i dette område, og den automatiske registreringsproces registrerer automatisk disse Delta-tabeller i lakehouse-metalageret.

Få mere at vide om oprettelse af en ADLS Gen2-genvej.

Mulighed 2: OneLake som lager

Hvis du vil bruge OneLake som et lagerlag og flytte data fra ADLS Gen2, skal du indledningsvist pege de Azure Synapse Spark-relaterede elementer på OneLake og derefter overføre de eksisterende data til OneLake. For det første skal du se Integrer OneLake med Azure Synapse Spark.

Hvis du vil flytte de eksisterende data til OneLake, har du flere muligheder:

  • mssparkutils fastcp: Biblioteket mssparkutils indeholder en fastcp-API, der giver dig mulighed for at kopiere data mellem ADLS Gen2 til OneLake.
  • AzCopy: Du kan bruge kommandolinjeværktøjet AzCopy til at kopiere data fra ADLS Gen2 til OneLake.
  • Azure Data Factory, Azure Synapse Analytics og Data Factory i Fabric: Brug kopiaktivitet til at kopiere data til lakehouse.
  • Brug genveje: Du kan aktivere historiske ADLS Gen2-data i OneLake ved hjælp af genveje. Der kræves ingen datakopi.
  • Azure Storage Explorer: Du kan flytte filer fra ADLS Gen2-placeringen til OneLake ved hjælp af Azure Storage Explorer. Se , hvordan du integrerer OneLake med Azure Storage Explorer.

Hvis dine Azure Synapse-datapipelines omfatter aktiviteter til definition af notesbøger og/eller Spark-job, skal du flytte disse pipelines fra Azure Synapse til Data Factory-datapipelines i Fabric og referere til målnotesbøgerne. Notesbogaktiviteten er tilgængelig i Data Factory-datapipelines. Se alle understøttede datapipelineaktiviteter i Fabric her.