Delen via


Gegevens en pijplijnen migreren van Azure Synapse Analytics naar Microsoft Fabric

De eerste stap in gegevens- en pijplijnmigratie is het identificeren van de gegevens die u beschikbaar wilt maken in OneLake en de pijplijnen die u wilt verplaatsen.

U hebt twee opties voor gegevensmigratie:

  • Optie 1: Azure Data Lake Storage (ADLS) Gen2 als standaardopslag. Als u momenteel ADLS Gen2 gebruikt en het kopiëren van gegevens wilt voorkomen, kunt u OneLake-snelkoppelingen gebruiken.
  • Optie 2: OneLake als standaardopslag. Als u wilt overstappen van ADLS Gen2 naar OneLake als opslaglaag, kunt u overwegen om van/naar OneLake te lezen/schrijven vanuit uw notebooks en Spark-taakdefinities.

Gegevensmigratie

Optie 1: ADLS Gen2 als opslag (snelkoppelingen)

Als u interactie hebt met ADLS Gen2 en dubbele gegevens wilt voorkomen, kunt u een snelkoppeling maken naar het ADLS Gen2-bronpad in OneLake. U kunt snelkoppelingen maken in de secties Bestanden en Tabellen van lakehouse in Fabric met de volgende overwegingen:

  • De sectie Bestanden is het onbeheerde gebied van het meer. Als uw gegevens een CSV-, JSON- of Parquet-indeling hebben, raden we u aan een snelkoppeling naar dit gebied te maken.
  • De sectie Tabellen is het beheerde gebied van het meer. Alle tabellen, zowel door Spark beheerde als onbeheerde tabellen, worden hier geregistreerd. Als uw gegevens een Delta-indeling hebben, kunt u een snelkoppeling maken in dit gebied en het automatische detectieproces worden deze Delta-tabellen automatisch geregistreerd in de metastore van lakehouse.

Meer informatie over het maken van een ADLS Gen2-snelkoppeling.

Optie 2: OneLake als opslag

Als u OneLake wilt gebruiken als een opslaglaag en gegevens wilt verplaatsen van ADLS Gen2, moet u eerst de Azure Synapse Spark-gerelateerde items naar OneLake laten verwijzen en vervolgens de bestaande gegevens overdragen naar OneLake. Zie OneLake integreren met Azure Synapse Spark voor de voormalige versie.

Als u de bestaande gegevens naar OneLake wilt verplaatsen, hebt u verschillende opties:

  • mssparkutils fastcp: De mssparkutils-bibliotheek biedt een fastcp-API waarmee u gegevens kunt kopiëren van ADLS Gen2 naar OneLake.
  • AzCopy: U kunt het opdrachtregelprogramma AzCopy gebruiken om gegevens van ADLS Gen2 naar OneLake te kopiëren.
  • Azure Data Factory, Azure Synapse Analytics en Data Factory in Fabric: kopieeractiviteit gebruiken om gegevens naar lakehouse te kopiëren.
  • Sneltoetsen gebruiken: U kunt historische ADLS Gen2-gegevens in OneLake inschakelen met behulp van snelkoppelingen. Er is geen gegevenskopie nodig.
  • Azure Storage Explorer: U kunt bestanden verplaatsen van ADLS Gen2-locatie naar OneLake met behulp van Azure Storage Explorer. Bekijk hoe u OneLake integreert met Azure Storage Explorer.

Als uw Azure Synapse-gegevenspijplijnen notebook- en/of Spark-taakdefinitieactiviteiten bevatten, moet u deze pijplijnen verplaatsen van Azure Synapse naar Data Factory-gegevenspijplijnen in Fabric en verwijzen naar de doelnotebooks. De notebookactiviteit is beschikbaar in Data Factory-gegevenspijplijnen. Bekijk hier alle ondersteunde activiteiten voor gegevenspijplijnen in Fabric.