Descripción de los cuadernos y las canalizaciones de Azure Databricks

3 minutos

En Azure Databricks, puede usar cuadernos para ejecutar código escrito en Python, Scala, SQL y otros lenguajes a fin de ingerir y procesar datos. Los cuadernos proporcionan una interfaz interactiva en la que puede ejecutar celdas de código individuales y usar Markdown para incluir notas y anotaciones.

En muchas soluciones de ingeniería de datos, el código escrito y probado de forma interactiva se puede incorporar posteriormente en una carga de trabajo de procesamiento de datos automatizado. En Azure, estas cargas de trabajo a menudo se implementan como canalizaciones en Azure Data Factory, en las que una o varias actividades se usan para orquestar una serie de tareas que se pueden ejecutar a petición, a intervalos programados o en respuesta a un evento (como los nuevos datos que se cargan en una carpeta de un lago de datos). Azure Data Factory admite una actividad de Notebook que se puede usar para automatizar la ejecución desatendida de un cuaderno en un área de trabajo de Azure Databricks.

A digram showing an Azure Data Factory pipeline with an activity that calls a notebook in Azure Databricks.

Nota:

La misma actividad de cuaderno está disponible en canalizaciones integradas en Azure Synapse Analytics.

Descripción de los cuadernos y las canalizaciones de Azure Databricks

Comentarios