Administración del formato del cuaderno
En este artículo se describe el formato de cuaderno predeterminado en Azure Databricks, cómo cambiar el formato del cuaderno y cómo administrar confirmaciones si el cuaderno está en una carpeta controlada por código fuente.
De forma predeterminada, los cuadernos de Databricks se crean en formato .ipynb
(IPython o Jupyter). También puede optar por usar el formato de origen en su lugar.
Todavía puede importar y exportar cuadernos en varios formatos. Consulta Exportación e importación de cuadernos de Databricks.
Formatos de cuaderno
Databricks admite la creación y edición de cuadernos en dos formatos: IPYNB (valor predeterminado) y origen.
Puedes administrar archivos de origen, incluidos cuadernos, mediante carpetas de Git. Solo se admiten determinados tipos de recursos de Databricks en carpetas de Git. El formato del cuaderno tiene implicaciones sobre los resultados que se comprometen en el repositorio remoto, como se describe en la tabla siguiente.
Formato source del cuaderno | Detalles |
---|---|
fuente | Un formato básico que solo captura el código fuente, con un sufijo que indica el lenguaje de código, como .py , .scala , .r y .sql . |
IPYNB (Jupyter) | Un formato enriquecido que captura el código fuente, el entorno del cuaderno, las definiciones de visualización, los widgets de cuaderno y las salidas opcionales. Un cuaderno IPYNB puede contener código en cualquier lenguaje admitido por los cuadernos de Databricks (a pesar de la parte py de .ipynb ). El formato IPYNB (Jupyter) permite al usuario confirmar las salidas opcionalmente. IPYNB también admite una experiencia de visualización mejorada para cuadernos de Databricks en repositorios remotos de Git. |
Para distinguir los cuadernos de Databricks de los archivos de Python, Scala y SQL normales, Azure Databricks agrega el comentario "Databricks notebook source
" a la parte superior de los cuadernos python, Scala y SQL. Este comentario garantiza que Azure Databricks analiza correctamente el archivo como un cuaderno en lugar de un archivo de script.
Nota
¿Qué son "salidas"?
Las salidas son los resultados de ejecutar un cuaderno en la plataforma de Databricks, incluidas las visualizaciones y las pantallas de tabla.
Cambiar la configuración predeterminada del formato del cuaderno
Los cuadernos IPYNB son el formato predeterminado al crear un cuaderno en Azure Databricks.
Para cambiar el valor predeterminado al formato de origen de Azure Databricks, inicia sesión en el área de trabajo de Azure Databricks, haz clic en el perfil en la esquina superior derecha de la página y, después, haz clic en Configuración y ve a Desarrollador. Cambie el formato predeterminado del cuaderno en la sección de configuración del editor bajo el encabezado .
Conversión del formato de cuaderno
Puede convertir un cuaderno existente a otro formato a través de la interfaz de usuario de Azure Databricks.
Para convertir un cuaderno existente a otro formato:
Abra el cuaderno en el área de trabajo.
Seleccione Archivo en el menú del área de trabajo y, después, seleccione formato de cuadernoy, después, elija el formato que desee. Puedes elegir Jupyter (.ipynb) (recomendado) u Source (.scala, .py, .sql, .r). El formato actual del cuaderno está grisado y tiene una marca de verificación junto a él.
Para obtener información sobre los tipos de cuadernos admitidos en Azure Databricks, lee Exportación e importación de cuadernos de Databricks.
Administración de confirmaciones de salida del cuaderno IPYNB
En el caso de los cuadernos IPYNB en carpetas controladas por código fuente, puedes administrar cómo se confirman las salidas del cuaderno en el repositorio remoto.
Habilitación de la confirmación de la salida del cuaderno .ipynb
Los resultados solo se pueden confirmar si un administrador del área de trabajo ha habilitado esta función. De manera predeterminada, la configuración administrativa de las carpetas Git no permite confirmar la salida del cuaderno .ipynb
. Si tiene privilegios de administrador para el área de trabajo, puede cambiar esta configuración:
Ve a Configuración de administrador>Configuración del área de trabajo en la consola de administrador de Azure Databricks.
En Carpetas Git, elige Permitir que las carpetas Git exporten salidas IPYNB y, después, selecciona Permitir: se pueden activar las salidas IPYNB en.
Importante
Cuando se incluyen resultados, las configuraciones de visualización y panel de control se incluyen en los cuadernos de.ipynb
que crea.
Control de las confirmaciones de artefactos de salida del cuaderno IPYNB
Al confirmar un archivo de .ipynb
, Databricks crea un archivo de configuración que te permite controlar cómo confirmas los resultados: .databricks/commit_outputs
.
Si tienes un archivo de cuaderno de
.ipynb
pero no hay ningún archivo de configuración en el repositorio remoto, ve al cuadro de diálogo Estado de Git.En el cuadro de diálogo de notificación, selecciona Crear archivo commit_outputs.
También puede generar archivos de configuración desde el menú Archivo. El menú Archivo tiene un control para actualizar automáticamente el archivo de configuración, donde puedes especificar la inclusión o exclusión de salidas de un cuaderno IPYNB específico.
En el menú Archivo, selecciona Confirmar salidas de cuadernos.
En el cuadro de diálogo, confirma su elección para confirmar las salidas del cuaderno.