Dela via


Migrera notebook-filer från Azure Synapse Analytics till Fabric

Azure Synapse och Fabric stöder notebook-filer. Du kan migrera en notebook-fil från Azure Synapse till Fabric på två olika sätt:

  • Alternativ 1: Du kan exportera notebook-filer från Azure Synapse (.ipynb) och importera dem till Infrastrukturresurser (manuellt).
  • Alternativ 2: Du kan använda ett skript för att exportera notebook-filer från Azure Synapse och importera dem till Infrastrukturresurser med hjälp av API:et.

För notebook-överväganden, se skillnader mellan Azure Synapse Spark och Fabric.

Förutsättningar

Om du inte redan har en skapar du en Infrastruktur-arbetsyta i klientorganisationen.

Alternativ 1: Exportera och importera notebook-filen manuellt

Så här exporterar du en notebook-fil från Azure Synapse:

  1. Öppna Synapse Studio: Logga in i Azure. Gå till din Azure Synapse-arbetsyta och öppna Synapse Studio.
  2. Leta upp anteckningsboken: Leta upp den anteckningsbok som du vill exportera från avsnittet Notebooks på arbetsytan i Synapse Studio.
  3. Exportera notebook-fil:
    • Högerklicka på den notebook-fil som du vill exportera.
    • Välj Exportera>notebook-fil (.ipynb).
    • Välj en målmapp och ange ett namn för den exporterade notebook-filen.
  4. När exporten är klar bör du ha notebook-filen tillgänglig för uppladdning.

Skärmbild som visar export av Synapse Notebook.

Så här importerar du den exporterade anteckningsboken i Infrastrukturresurser:

  1. Access Fabric-arbetsyta: Logga in på Infrastrukturresurser och få åtkomst till din arbetsyta.
  2. Gå till startsidan för Dataingenjör ing: Gå till startsidan för Dataingenjör ing när du är inne på din infrastrukturarbetsyta.
  3. Importera notebook-fil:
    • Välj Importera anteckningsbok. Du kan importera en eller flera befintliga notebook-filer från din lokala dator till en Infrastruktur-arbetsyta.
    • Bläddra efter de .ipynb notebook-filer som du laddade ned från Azure Synapse Analytics.
    • Välj notebook-filerna och klicka på Ladda upp.
  4. Öppna och använd notebook-filen: När importen har slutförts kan du öppna och använda notebook-filen på arbetsytan Infrastruktur.

När notebook-filen har importerats verifierar du notebook-beroenden:

  • Se till att använda samma Spark-version.
  • Om du använder refererade notebook-filer kan du använda msparkutils även i Infrastrukturresurser. Men om du importerar en notebook-fil som refererar till en annan måste du även importera den senare. Infrastrukturarbetsytan stöder inte mappar för tillfället, så alla referenser till notebook-filer i andra mappar bör uppdateras. Du kan använda notebook-resurser om det behövs.
  • Om en notebook-fil använder poolspecifika bibliotek och konfigurationer måste du även importera dessa bibliotek och/eller konfigurationer.
  • Länkade tjänster, datakällanslutningar och monteringspunkter.

Alternativ 2: Använd Infrastruktur-API:et

Följ de här viktiga stegen för migrering:

  • Förutsättningar.
  • Steg 1: Exportera notebook-filer från Azure Synapse till OneLake (.ipynb).
  • Steg 2: Importera notebook-filer automatiskt till Infrastrukturresurser med hjälp av Infrastruktur-API:et.

Förutsättningar

Kraven omfattar åtgärder som du måste tänka på innan du påbörjar migreringen av notebook-filer till Infrastrukturresurser.

  • En infrastrukturarbetsyta.
  • Om du inte redan har en skapar du en Infrastruktursjöhus på din arbetsyta.

Steg 1: Exportera notebook-filer från Azure Synapse-arbetsytan

Fokus för steg 1 är att exportera notebook-filer från Azure Synapse-arbetsytan till OneLake i .ipynb-format. Den här processen är följande:

  • 1.1) Importera migreringsanteckningsboken till Arbetsytan Infrastruktur . Den här notebook-filen exporterar alla notebook-filer från en viss Azure Synapse-arbetsyta till en mellanliggande katalog i OneLake. Synapse API används för att exportera notebook-filer.
  • 1.2) Konfigurera parametrarna i det första kommandot för att exportera notebook-filer till en mellanliggande lagring (OneLake). Följande kodfragment används för att konfigurera käll- och målparametrarna. Se till att ersätta dem med dina egna värden.
# Azure config
azure_client_id = "<client_id>"
azure_tenant_id = "<tenant_id>"
azure_client_secret = "<client_secret>"

# Azure Synapse workspace config
synapse_workspace_name = "<synapse_workspace_name>"

# Fabric config
workspace_id = "<workspace_id>"
lakehouse_id = "<lakehouse_id>"
export_folder_name = f"export/{synapse_workspace_name}"
prefix = "" # this prefix is used during import {prefix}{notebook_name}

output_folder = f"abfss://{workspace_id}@onelake.dfs.fabric.microsoft.com/{lakehouse_id}/Files/{export_folder_name}"
  • 1.3) Kör de två första cellerna i export-/importanteckningsboken för att exportera notebook-filer till OneLake. När cellerna har slutförts skapas den här mappstrukturen under den mellanliggande utdatakatalogen.

Skärmbild som visar notebook-export i OneLake.

Steg 2: Importera notebook-filer till Infrastrukturresurser

Steg 2 är när notebook-filer importeras från mellanliggande lagring till arbetsytan Infrastrukturresurser. Den här processen är följande:

  • 2.1) Verifiera konfigurationerna i steg 1.2 för att säkerställa att rätt infrastrukturarbetsyta och prefixvärden anges för att importera notebook-filerna.
  • 2.2) Kör den tredje cellen i export-/importanteckningsboken för att importera alla notebook-filer från mellanliggande plats.