Gegevens en pijplijnen migreren van Azure Synapse Analytics naar Microsoft Fabric
De eerste stap in gegevens- en pijplijnmigratie is het identificeren van de gegevens die u beschikbaar wilt maken in OneLake en de pijplijnen die u wilt verplaatsen.
U hebt twee opties voor gegevensmigratie:
- Optie 1: Azure Data Lake Storage (ADLS) Gen2 als standaardopslag. Als u momenteel ADLS Gen2 gebruikt en het kopiëren van gegevens wilt voorkomen, kunt u OneLake-snelkoppelingen gebruiken.
- Optie 2: OneLake als standaardopslag. Als u wilt overstappen van ADLS Gen2 naar OneLake als opslaglaag, kunt u overwegen om van/naar OneLake te lezen/schrijven vanuit uw notebooks en Spark-taakdefinities.
Gegevensmigratie
Optie 1: ADLS Gen2 als opslag (snelkoppelingen)
Als u interactie hebt met ADLS Gen2 en dubbele gegevens wilt voorkomen, kunt u een snelkoppeling maken naar het ADLS Gen2-bronpad in OneLake. U kunt snelkoppelingen maken in de secties Bestanden en Tabellen van lakehouse in Fabric met de volgende overwegingen:
- De sectie Bestanden is het onbeheerde gebied van het meer. Als uw gegevens een CSV-, JSON- of Parquet-indeling hebben, raden we u aan een snelkoppeling naar dit gebied te maken.
- De sectie Tabellen is het beheerde gebied van het meer. Alle tabellen, zowel door Spark beheerde als onbeheerde tabellen, worden hier geregistreerd. Als uw gegevens een Delta-indeling hebben, kunt u een snelkoppeling maken in dit gebied en het automatische detectieproces worden deze Delta-tabellen automatisch geregistreerd in de metastore van lakehouse.
Meer informatie over het maken van een ADLS Gen2-snelkoppeling.
Optie 2: OneLake als opslag
Als u OneLake wilt gebruiken als een opslaglaag en gegevens wilt verplaatsen van ADLS Gen2, moet u eerst de Azure Synapse Spark-gerelateerde items naar OneLake laten verwijzen en vervolgens de bestaande gegevens overdragen naar OneLake. Zie OneLake integreren met Azure Synapse Spark voor de voormalige versie.
Als u de bestaande gegevens naar OneLake wilt verplaatsen, hebt u verschillende opties:
- mssparkutils fastcp: De mssparkutils-bibliotheek biedt een fastcp-API waarmee u gegevens kunt kopiëren van ADLS Gen2 naar OneLake.
- AzCopy: U kunt het opdrachtregelprogramma AzCopy gebruiken om gegevens van ADLS Gen2 naar OneLake te kopiëren.
- Azure Data Factory, Azure Synapse Analytics en Data Factory in Fabric: kopieeractiviteit gebruiken om gegevens naar lakehouse te kopiëren.
- Sneltoetsen gebruiken: U kunt historische ADLS Gen2-gegevens in OneLake inschakelen met behulp van snelkoppelingen. Er is geen gegevenskopie nodig.
- Azure Storage Explorer: U kunt bestanden verplaatsen van ADLS Gen2-locatie naar OneLake met behulp van Azure Storage Explorer. Bekijk hoe u OneLake integreert met Azure Storage Explorer.
Migratie van pijplijnen (spark-gerelateerde activiteiten)
Als uw Azure Synapse-gegevenspijplijnen notebook- en/of Spark-taakdefinitieactiviteiten bevatten, moet u deze pijplijnen verplaatsen van Azure Synapse naar Data Factory-gegevenspijplijnen in Fabric en verwijzen naar de doelnotebooks. De notebookactiviteit is beschikbaar in Data Factory-gegevenspijplijnen. Bekijk hier alle ondersteunde activiteiten voor gegevenspijplijnen in Fabric.
- Raadpleeg de verschillen tussen Azure Synapse Spark en Fabric voor overwegingen met betrekking tot gegevenspijplijnen.
- Raadpleeg voor notebookmigratie notebooks migreren van Azure Synapse naar Fabric.
- Zie Migreren naar Data Factory in Fabric voor migratie van gegevenspijplijnen.