Dela via


Hantera anteckningsboksformat

I den här artikeln beskrivs standardformatet för notebook-filer i Azure Databricks, hur du ändrar notebook-format och hur du hanterar incheckningar om din notebook-fil finns i en källkontrollerad mapp.

Som standard skapas notebook-filer i Databricks i .ipynb-format (IPython eller Jupyter). Du kan också välja att använda källformat i stället.

Du kan fortfarande importera och exportera notebook-filer i olika format. Se Exportera och importera Databricks-notebook-filer.

Notebook-format

Databricks har stöd för att skapa och redigera notebook-filer i två format: IPYNB (standard) och källa.

Du kan hantera källfiler, inklusive notebook-filer, med hjälp av Git-mappar. Endast vissa Databricks-tillgångstyper stöds i Git-mappar. Notebook-formatet påverkar vilka utdata som skickas till fjärrlagringsplatsen enligt beskrivningen i table nedan.

Anteckningsbokens källformat Detaljer
källa Ett grundläggande format som endast samlar in källkod med ett suffix som signalerar kodspråket, till exempel .py, .scala, .r och .sql.
IPYNB (Jupyter) Ett omfattande format som samlar in källkod, notebook-miljö, visualiseringsdefinitioner, notebook-widgetar och valfria utdata. En IPYNB-notebook-fil kan innehålla kod på valfritt språk som stöds av Databricks-notebook-filer (trots py del av .ipynb). Med IPYNB-formatet (Jupyter) har användaren möjlighet att spara utdata. IPYNB stöder också en bättre visningsupplevelse för Databricks-notebook-filer på fjärranslutna Git-lagringsplatser.

För att skilja databricks notebook-filer från vanliga Python-, Scala- och SQL-filer lägger Azure Databricks till kommentaren "Databricks notebook source" överst i Notebook-filer för Python, Scala och SQL. Den här kommentaren säkerställer att Azure Databricks tolkar filen korrekt som en notebook-fil i stället för en skriptfil.

Notera

Vad är "utdata"?

Utdata är de resultat som genereras när en notebook körs på Databricks-plattformen, inklusive table-displayer och visualiseringar.

Ändra standardinställningen för notebook-format

IPYNB-notebook-filer är standardformatet när du skapar en ny notebook-fil i Azure Databricks.

Om du vill ändra standardvärdet till Azure Databricks-källformatet loggar du in på din Azure Databricks-arbetsyta, klickar på din profil längst upp till höger på sidan och klickar sedan på Inställningar och navigerar till Developer. Ändra standardformatet för anteckningsboken under Redigerarinställningar rubriken.

Ändra standardformatet för notebook-filer i utvecklarinställningarna för din profil

Konvertera anteckningsboksformat

Du kan konvertera en befintlig notebook-fil till ett annat format via Azure Databricks-användargränssnittet.

Så här konverterar du en befintlig notebook-fil till ett annat format:

  1. Öppna anteckningsboken på arbetsytan.

  2. Select Fil från arbetsytemenyn och sedan selectNotebook-formatoch välj sedan önskat format. Du kan välja antingen Jupyter (.ipynb) (rekommenderas) eller Source (.scala, .py, .sql, .r). Anteckningsbokens aktuella format är nedtonat och har en bockmarkering bredvid sig.

    Arbetsytans arkivmeny, expanderad, med notisformatsalternativ.

Mer information om vilka typer av notebook-filer som stöds i Azure Databricks finns i Exportera och importera Databricks-notebook-filer.

Hantera ändringar av utdata för IPYNB-notebook-filer

För IPYNB-notebook-filer i källkontrollerade mappar kan du hantera hur notebook-utdata skickas till fjärrlagringsplatsen.

Tillåt kommittering av .ipynb notebook-utdata

Utdata kan bara bekräftas om en arbetsyteadministratör har aktiverat den här funktionen. Som standardinställning tillåter inte den administrativa inställningen för Git-mappar att utdata från notebook .ipynb checkas in. Om du har administratörsbehörighet för arbetsytan kan du ändra den här inställningen:

  1. Gå till Administratörsinställningar>Arbetsyteinställningar i Azure Databricks-administratörskonsolen.

  2. Under Git-mapparväljer du Tillåt Att Git-mappar exporterar IPYNB-utdata och sedan selectTillåt: IPYNB-utdata kan växlas på.

    administratörskonsol: Tillåt Att Git-mappar exporterar IPYNB-utdata.

Viktig

När utdata finns med inkluderas visualiserings- och instrumentpanelskonfigurationerna i de.ipynb anteckningsböcker som du skapar.

Kontrollera IPYNB-notebookens utdataartefakt-incheckningar

När du committar en .ipynb-fil skapar Databricks en konfigurationsfil som låter dig kontrollera hur du committar utdata: .databricks/commit_outputs.

  1. Om du har en .ipynb notebook-fil men ingen konfigurationsfil på fjärrlagringsplatsen går du till dialogrutan Git-status.

  2. I meddelandedialogrutan selectSkapa commit_outputs-fil.

    Notebook-åtgärdsgränssnitt: Skapa commit_outputs-fil-knappen.

Du kan också generate konfigurationsfiler från menyn File. Menyn File har en kontroll för att automatiskt update konfigurationsfilen where, där du kan ange inkludering eller exkludering av utdata för en specifik IPYNB-notebook.

  1. I menyn FileselectCommit notebooks-utdata (Checka in anteckningsböckers utdata).

    Notebook-redigeraren: Kommitta notebooks utdata status och kontroll.

  2. I dialogrutan bekräftar du ditt val av att kommittera notebook-utdata.

    dialogrutan för att spara notebook-utdata.