¿Qué es la extensión de Databricks para Visual Studio Code?
La extensión de Databricks para Visual Studio Code le permite conectarse a las áreas de trabajo remotas de Azure Databricks desde el entorno de desarrollo integrado (IDE) de Visual Studio Code que se ejecuta en la máquina de desarrollo local. Luego, puede:
- Defina, implemente y ejecute agrupaciones de recursos de Databricks para aplicar patrones de CI/CD y procedimientos recomendados a los trabajos de Azure Databricks, las canalizaciones de Delta Live Tables y las pilas de MLOps mediante la interfaz de usuario de Visual Studio Code. Vea ¿Qué son las Agrupaciones de recursos de Databricks? y Características de extensión de Agrupaciones de recursos de Databricks.
- Ejecute archivos de código de Python locales desde Visual Studio Code en clústeres de Azure Databricks en las áreas de trabajo remotas. Vea Ejecución de un archivo de Python en un clúster.
- Ejecute archivos de código de Python locales (
.py
) y cuadernos de Python, R, Scala y SQL (.py
,.ipynb
,.r
,.scala
y.sql
) desde Visual Studio Code como trabajos de Azure Databricks en las áreas de trabajo remotas. Vea Ejecución de un archivo de Python como trabajo. - Configure el entorno de depuración y Databricks Connect mediante una lista de comprobación sencilla que desencadena diálogos de selección. Vea Depuración de código mediante Databricks Connect para la extensión de Databricks para Visual Studio Code.
- Depure celdas de cuadernos por celda dentro de Visual Studio Code con Databricks Connect. Vea Ejecución y depuración de celdas de cuaderno con Databricks Connect mediante la extensión de Databricks para Visual Studio Code.
- Sincronice el código local que desarrolle en Visual Studio Code con código en las áreas de trabajo remotas. Consulte Sincronizar la carpeta del área de trabajo con Databricks
Nota:
La extensión de Databricks para Visual Studio Code admite la ejecución de cuadernos de R, Scala y SQL como trabajos automatizados, pero no proporciona ninguna compatibilidad más profunda con estos lenguajes dentro de Visual Studio Code.
Introducción
A fin de empezar a usar la extensión de Databricks para Visual Studio Code:
- Instale la extensión.
- Crear un nuevo proyecto de Databricks o convertir un proyecto de Visual Studio Code existente.
- Configure el proyecto fácilmente mediante la interfaz de usuario de la extensión de Databricks.
- Ejecute código de Python como parte del tutorial de extensión.
- Depure el código mediante la integración de Databricks Connect.
- Pruebe el código mediante
pytest
. Vea Ejecución de pruebas con pytest mediante la extensión de Databricks para Visual Studio Code.
Creación de un nuevo proyecto de Databricks
Una vez instalada la extensión, puede crear un proyecto de Databricks mediante la extensión de Databricks para Visual Studio Code:
- Inicie Visual Studio Code.
- En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
- Haga clic en Crear un nuevo proyecto.
- En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de autenticación para la extensión de Databricks para Visual Studio Code.
- En Proporcionar una ruta de acceso a una carpeta en la que quiere que esté el nuevo proyecto, escriba la ruta de acceso a una carpeta en el equipo de desarrollo local donde quiera crear el proyecto o haga clic en el cuadro de diálogo Abrir selección de carpetas y seleccione la ruta de acceso a la carpeta del proyecto.
- En Plantilla que se va a usar en la vista de inicialización del proyecto de Databricks, use las flechas arriba y abajo para seleccionar una plantilla de proyecto y presione Entrar. Para obtener información sobre las plantillas de proyecto de agrupaciones de Databricks, consulta Plantillas de proyecto de agrupación de recursos de Databricks.
- Para el proyecto, escriba un Nombre único para este proyecto o deje el nombre de proyecto predeterminado de
my_project
y luego presione Entrar. - Elija si quiere agregar un cuaderno de código auxiliar (ejemplo), una canalización de Delta Live Tables (ejemplo) o un paquete de Python de código auxiliar (ejemplo) al proyecto, o cualquier combinación de estos códigos auxiliares (ejemplos).
- Presione cualquier tecla para cerrar la pestaña del editor Inicialización del proyecto de Databricks.
- En Seleccionar el proyecto que quiere abrir, elija el proyecto que acaba de crear.
Apertura de un proyecto existente de Agrupaciones de recursos de Databricks
Un proyecto de Agrupaciones de recursos de Databricks tiene un archivo databricks.yml
en la carpeta raíz del proyecto. Consulta Configuración de agrupaciones de recursos de Databricks. Si desea usar la extensión con un proyecto de Conjuntos de recursos de Databricks existente:
Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta y vaya al directorio que contiene el proyecto de agrupación.
Haga clic en el icono de Databricks en la barra lateral de Visual Studio Code para abrir y empezar a usar las características de la extensión.
Si la extensión de Databricks para Visual Studio Code detecta más de un proyecto de Conjuntos de recursos de Databricks en la carpeta actual, le permite abrir un proyecto o crear un archivo de configuración de proyecto en la carpeta raíz.
- Si eligió un proyecto, en la Paleta de comandos, seleccione su proyecto existente de Paquetes de activos de Databricks.
- Si crea una configuración en la carpeta raíz, esa carpeta se convierte en un proyecto de agrupación.
Seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de autenticación para la extensión de Databricks para Visual Studio Code.
Nota:
Si abre un proyecto creado con la extensión de Databricks para Visual Studio Code v1, la migración se intentará automáticamente mediante la configuración de área de trabajo y autenticación existente del proyecto. El botón de migración solo está disponible si se produce un error en la migración automática.
Cambio entre proyectos de Databricks
La extensión de Databricks para Visual Studio Code permite tener varios proyectos de Databricks en el área de trabajo de Visual Studio Code y cambiar fácilmente entre ellos. Con su proyecto con múltiples paquetes abierto en el área de trabajo de Visual Studio Code:
En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
Haga clic en la Carpeta local para seleccionar el proyecto que va a usar la extensión.
selector de carpetas locales
Nota:
Las acciones de ejecución solo están disponibles para los archivos del lote activo.
Convertir un proyecto en un proyecto de Databricks
Si tiene un proyecto existente que desea convertir en un proyecto de Databricks:
- Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta y vaya al proyecto para abrirlo.
- En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
- Haga clic en Crear configuración.
- En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de autenticación para la extensión de Databricks para Visual Studio Code.