Introducción a los cuadernos de Databricks
Los cuadernos son una herramienta común en la ciencia de datos y el aprendizaje automático para desarrollar código y presentar resultados. En Azure Databricks, los cuadernos son la herramienta principal para crear flujos de trabajo de ciencia de datos y aprendizaje automático y colaborar con compañeros. Los cuadernos de Databricks proporcionan coautoría en tiempo real en varios idiomas, control de versiones automático y visualizaciones de datos integradas.
Con los cuadernos de Azure Databricks, puede hacer lo siguiente:
- Desarrollar código mediante Python, SQL, Scala y R.
- Personalice el entorno con las bibliotecas que prefiera.
- Cree trabajos programados periódicamente para ejecutar automáticamente tareas, incluidos los flujos de trabajo de varios cuadernos.
- Examen y acceso a tablas y volúmenes.
- Exporte los resultados y cuadernos en formato
.html
o.ipynb
. - Use un repositorio basado en Git para almacenar los cuadernos con archivos y dependencias asociados.
- Creación y uso compartido de paneles.
- Apertura o ejecución de una canalización de Delta Live Tables.
- (Experimental) Use funcionalidades de edición avanzadas.
Los cuadernos también son útiles para el análisis de datos exploratorios (EDA).
Importación y ejecución de cuadernos de ejemplo
La documentación de Azure Databricks incluye muchos cuadernos de ejemplo que están diseñados para ilustrar cómo usar las funcionalidades de Databricks. Para importar uno de estos cuadernos en un área de trabajo de Databricks:
Haga clic en Copy link for import (Copiar vínculo para importar) en la esquina superior derecha de la vista previa del cuaderno que aparece en la página.
Cuaderno de Python del inicio rápido de registro automático de MLflow
En el explorador del área de trabajo, navegue a la ubicación en la que desea importar el cuaderno.
Haga clic con el botón derecho en la carpeta y seleccione Importar en el menú.
Haga clic en el botón de radio URL y pegue el vínculo que acaba de copiar en el campo.
Haga clic en Import. El cuaderno se importa y se abre automáticamente en el área de trabajo. Los cambios realizados en el cuaderno se guardan automáticamente. Para obtener información sobre cómo editar cuadernos en el área de trabajo, consulte Desarrollo de código en cuadernos de Databricks.
Para ejecutar el cuaderno, haga clic en el en la parte superior del cuaderno. Para más información sobre cómo ejecutar cuadernos y celdas de cuaderno individuales, consulte Ejecución de cuadernos de Databricks.
Para crear un cuaderno en blanco en el área de trabajo, consulte Creación de un cuaderno.
Orientación del cuaderno
Más información sobre la interfaz y los controles del cuaderno
Empezar a usar cuadernos de Databricks
- Administrar cuadernos: cree, cambie el nombre, elimine, obtenga la ruta de acceso del cuaderno y configure las opciones del editor.
- Desarrollar y editar código en cuadernos.
- Ayuda para obtener codificación asistida por IA.
- Uso del depurador interactivo.
- Trabajar con salidas de celda: descargar resultados y visualizaciones, controlar la visualización de los resultados en el cuaderno.
- Ejecutar cuadernos y programar trabajos normales.
- Colaborar mediante cuadernos: compartir un cuaderno y usar comentarios en cuadernos.
- Importación y exportación de cuadernos.
- Probar cuadernos.
- Personalizar las bibliotecas del cuaderno.