Migrera notebook-filer från Azure Synapse Analytics till Fabric
Azure Synapse och Fabric stöder notebook-filer. Du kan migrera en notebook-fil från Azure Synapse till Fabric på två olika sätt:
- Alternativ 1: Du kan exportera notebook-filer från Azure Synapse (.ipynb) och importera dem till Infrastrukturresurser (manuellt).
- Alternativ 2: Du kan använda ett skript för att exportera notebook-filer från Azure Synapse och importera dem till Infrastrukturresurser med hjälp av API:et.
För notebook-överväganden, se skillnader mellan Azure Synapse Spark och Fabric.
Förutsättningar
Om du inte redan har en skapar du en Infrastruktur-arbetsyta i klientorganisationen.
Alternativ 1: Exportera och importera notebook-filen manuellt
Så här exporterar du en notebook-fil från Azure Synapse:
- Öppna Synapse Studio: Logga in i Azure. Gå till din Azure Synapse-arbetsyta och öppna Synapse Studio.
- Leta upp anteckningsboken: Leta upp den anteckningsbok som du vill exportera från avsnittet Notebooks på arbetsytan i Synapse Studio.
-
Exportera notebook-fil:
- Högerklicka på den notebook-fil som du vill exportera.
- Välj Exportera>notebook-fil (.ipynb).
- Välj en målmapp och ange ett namn för den exporterade notebook-filen.
- När exporten är klar bör du ha notebook-filen tillgänglig för uppladdning.
Så här importerar du den exporterade anteckningsboken i Infrastrukturresurser:
- Access Fabric-arbetsyta: Logga in på Infrastrukturresurser och få åtkomst till din arbetsyta.
- Gå till startsidan för Dataingenjör ing: Gå till startsidan för Dataingenjör ing när du är inne på din infrastrukturarbetsyta.
-
Importera notebook-fil:
- Välj Importera anteckningsbok. Du kan importera en eller flera befintliga notebook-filer från din lokala dator till en Infrastruktur-arbetsyta.
- Bläddra efter de .ipynb notebook-filer som du laddade ned från Azure Synapse Analytics.
- Välj notebook-filerna och klicka på Ladda upp.
- Öppna och använd notebook-filen: När importen har slutförts kan du öppna och använda notebook-filen på arbetsytan Infrastruktur.
När notebook-filen har importerats verifierar du notebook-beroenden:
- Se till att använda samma Spark-version.
- Om du använder refererade notebook-filer kan du använda msparkutils även i Infrastrukturresurser. Men om du importerar en notebook-fil som refererar till en annan måste du även importera den senare. Infrastrukturarbetsytan stöder inte mappar för tillfället, så alla referenser till notebook-filer i andra mappar bör uppdateras. Du kan använda notebook-resurser om det behövs.
- Om en notebook-fil använder poolspecifika bibliotek och konfigurationer måste du även importera dessa bibliotek och/eller konfigurationer.
- Länkade tjänster, datakällanslutningar och monteringspunkter.
Alternativ 2: Använd Infrastruktur-API:et
Följ de här viktiga stegen för migrering:
- Förutsättningar.
- Steg 1: Exportera notebook-filer från Azure Synapse till OneLake (.ipynb).
- Steg 2: Importera notebook-filer automatiskt till Infrastrukturresurser med hjälp av Infrastruktur-API:et.
Förutsättningar
Kraven omfattar åtgärder som du måste tänka på innan du påbörjar migreringen av notebook-filer till Infrastrukturresurser.
- En infrastrukturarbetsyta.
- Om du inte redan har en skapar du en Infrastruktursjöhus på din arbetsyta.
Steg 1: Exportera notebook-filer från Azure Synapse-arbetsytan
Fokus för steg 1 är att exportera notebook-filer från Azure Synapse-arbetsytan till OneLake i .ipynb-format. Den här processen är följande:
- 1.1) Importera migreringsanteckningsboken till Arbetsytan Infrastruktur . Den här notebook-filen exporterar alla notebook-filer från en viss Azure Synapse-arbetsyta till en mellanliggande katalog i OneLake. Synapse API används för att exportera notebook-filer.
- 1.2) Konfigurera parametrarna i det första kommandot för att exportera notebook-filer till en mellanliggande lagring (OneLake). Följande kodfragment används för att konfigurera käll- och målparametrarna. Se till att ersätta dem med dina egna värden.
# Azure config
azure_client_id = "<client_id>"
azure_tenant_id = "<tenant_id>"
azure_client_secret = "<client_secret>"
# Azure Synapse workspace config
synapse_workspace_name = "<synapse_workspace_name>"
# Fabric config
workspace_id = "<workspace_id>"
lakehouse_id = "<lakehouse_id>"
export_folder_name = f"export/{synapse_workspace_name}"
prefix = "" # this prefix is used during import {prefix}{notebook_name}
output_folder = f"abfss://{workspace_id}@onelake.dfs.fabric.microsoft.com/{lakehouse_id}/Files/{export_folder_name}"
- 1.3) Kör de två första cellerna i export-/importanteckningsboken för att exportera notebook-filer till OneLake. När cellerna har slutförts skapas den här mappstrukturen under den mellanliggande utdatakatalogen.
Steg 2: Importera notebook-filer till Infrastrukturresurser
Steg 2 är när notebook-filer importeras från mellanliggande lagring till arbetsytan Infrastrukturresurser. Den här processen är följande:
- 2.1) Verifiera konfigurationerna i steg 1.2 för att säkerställa att rätt infrastrukturarbetsyta och prefixvärden anges för att importera notebook-filerna.
- 2.2) Kör den tredje cellen i export-/importanteckningsboken för att importera alla notebook-filer från mellanliggande plats.