Hantera anteckningsboksformat
I den här artikeln beskrivs standardformatet för notebook-filer i Azure Databricks, hur du ändrar notebook-format och hur du hanterar incheckningar om din notebook-fil finns i en källkontrollerad mapp.
Som standard skapas notebook-filer i Databricks i .ipynb
-format (IPython eller Jupyter). Du kan också välja att använda källformat i stället.
Du kan fortfarande importera och exportera notebook-filer i olika format. Se Exportera och importera Databricks-notebook-filer.
Notebook-format
Databricks har stöd för att skapa och redigera notebook-filer i två format: IPYNB (standard) och källa.
Du kan hantera källfiler, inklusive notebook-filer, med hjälp av Git-mappar. Endast vissa Databricks-tillgångstyper stöds i Git-mappar. Notebook-formatet påverkar vilka utdata som skickas till fjärrlagringsplatsen enligt beskrivningen i table nedan.
Anteckningsbokens källformat | Detaljer |
---|---|
källa | Ett grundläggande format som endast samlar in källkod med ett suffix som signalerar kodspråket, till exempel .py , .scala , .r och .sql . |
IPYNB (Jupyter) | Ett omfattande format som samlar in källkod, notebook-miljö, visualiseringsdefinitioner, notebook-widgetar och valfria utdata. En IPYNB-notebook-fil kan innehålla kod på valfritt språk som stöds av Databricks-notebook-filer (trots py del av .ipynb ). Med IPYNB-formatet (Jupyter) har användaren möjlighet att spara utdata. IPYNB stöder också en bättre visningsupplevelse för Databricks-notebook-filer på fjärranslutna Git-lagringsplatser. |
För att skilja databricks notebook-filer från vanliga Python-, Scala- och SQL-filer lägger Azure Databricks till kommentaren "Databricks notebook source
" överst i Notebook-filer för Python, Scala och SQL. Den här kommentaren säkerställer att Azure Databricks tolkar filen korrekt som en notebook-fil i stället för en skriptfil.
Notera
Vad är "utdata"?
Utdata är de resultat som genereras när en notebook körs på Databricks-plattformen, inklusive table-displayer och visualiseringar.
Ändra standardinställningen för notebook-format
IPYNB-notebook-filer är standardformatet när du skapar en ny notebook-fil i Azure Databricks.
Om du vill ändra standardvärdet till Azure Databricks-källformatet loggar du in på din Azure Databricks-arbetsyta, klickar på din profil längst upp till höger på sidan och klickar sedan på Inställningar och navigerar till Developer. Ändra standardformatet för anteckningsboken under Redigerarinställningar rubriken.
Konvertera anteckningsboksformat
Du kan konvertera en befintlig notebook-fil till ett annat format via Azure Databricks-användargränssnittet.
Så här konverterar du en befintlig notebook-fil till ett annat format:
Öppna anteckningsboken på arbetsytan.
Select Fil från arbetsytemenyn och sedan selectNotebook-formatoch välj sedan önskat format. Du kan välja antingen Jupyter (.ipynb) (rekommenderas) eller Source (.scala, .py, .sql, .r). Anteckningsbokens aktuella format är nedtonat och har en bockmarkering bredvid sig.
Mer information om vilka typer av notebook-filer som stöds i Azure Databricks finns i Exportera och importera Databricks-notebook-filer.
Hantera ändringar av utdata för IPYNB-notebook-filer
För IPYNB-notebook-filer i källkontrollerade mappar kan du hantera hur notebook-utdata skickas till fjärrlagringsplatsen.
Tillåt kommittering av .ipynb
notebook-utdata
Utdata kan bara bekräftas om en arbetsyteadministratör har aktiverat den här funktionen. Som standardinställning tillåter inte den administrativa inställningen för Git-mappar att utdata från notebook .ipynb
checkas in. Om du har administratörsbehörighet för arbetsytan kan du ändra den här inställningen:
Gå till Administratörsinställningar>Arbetsyteinställningar i Azure Databricks-administratörskonsolen.
Under Git-mapparväljer du Tillåt Att Git-mappar exporterar IPYNB-utdata och sedan selectTillåt: IPYNB-utdata kan växlas på.
Viktig
När utdata finns med inkluderas visualiserings- och instrumentpanelskonfigurationerna i de.ipynb
anteckningsböcker som du skapar.
Kontrollera IPYNB-notebookens utdataartefakt-incheckningar
När du committar en .ipynb
-fil skapar Databricks en konfigurationsfil som låter dig kontrollera hur du committar utdata: .databricks/commit_outputs
.
Om du har en
.ipynb
notebook-fil men ingen konfigurationsfil på fjärrlagringsplatsen går du till dialogrutan Git-status.I meddelandedialogrutan selectSkapa commit_outputs-fil.
Du kan också generate konfigurationsfiler från menyn File. Menyn File har en kontroll för att automatiskt update konfigurationsfilen where, där du kan ange inkludering eller exkludering av utdata för en specifik IPYNB-notebook.
I menyn FileselectCommit notebooks-utdata (Checka in anteckningsböckers utdata).
I dialogrutan bekräftar du ditt val av att kommittera notebook-utdata.