¿Qué es la extensión de Databricks para Visual Studio Code?
La extensión de Databricks para Visual Studio Code le permite conectarse a las áreas de trabajo remotas de Azure Databricks desde el entorno de desarrollo integrado (IDE) de Visual Studio Code que se ejecuta en la máquina de desarrollo local. Luego, puede:
- Defina, implemente y ejecute agrupaciones de recursos de Databricks para aplicar patrones de CI/CD y procedimientos recomendados a los trabajos de Azure Databricks, las canalizaciones de Delta Live Tables y las pilas de MLOps mediante la interfaz de usuario de Visual Studio Code. Vea ¿Qué son las Agrupaciones de recursos de Databricks? y Características de extensión de Agrupaciones de recursos de Databricks.
- Ejecute archivos de código de Python locales desde Visual Studio Code en clústeres de Azure Databricks en las áreas de trabajo remotas. Vea Ejecución de un archivo de Python en un clúster.
- Ejecute archivos de código de Python locales (
.py
) y cuadernos de Python, R, Scala y SQL (.py
,.ipynb
,.r
,.scala
y.sql
) desde Visual Studio Code como trabajos de Azure Databricks en las áreas de trabajo remotas. Vea Ejecución de un archivo de Python como trabajo. - Configure el entorno de depuración y Databricks Connect mediante una lista de comprobación sencilla que desencadena diálogos de selección. Vea Depuración de código mediante Databricks Connect para la extensión de Databricks para Visual Studio Code.
- Depure celdas de cuadernos por celda dentro de Visual Studio Code con Databricks Connect. Vea Ejecución y depuración de celdas de cuaderno con Databricks Connect mediante la extensión de Databricks para Visual Studio Code.
- Sincronice el código local que desarrolle en Visual Studio Code con código en las áreas de trabajo remotas.
Nota:
La extensión de Databricks para Visual Studio Code admite la ejecución de cuadernos de R, Scala y SQL como trabajos automatizados, pero no proporciona ninguna compatibilidad más profunda con estos lenguajes dentro de Visual Studio Code.
Introducción
A fin de empezar a usar la extensión de Databricks para Visual Studio Code:
- Instale la extensión.
- Cree un proyecto de Databricks o migre uno existente de Visual Studio Code.
- Configure el proyecto fácilmente mediante la interfaz de usuario de la extensión de Databricks.
- Ejecute código de Python como parte del tutorial de extensión.
- Depure el código mediante la integración de Databricks Connect.
- Pruebe el código mediante
pytest
. Vea Ejecución de pruebas con pytest mediante la extensión de Databricks para Visual Studio Code.
Creación de un nuevo proyecto de Databricks
Una vez instalada la extensión, puede crear un proyecto de Databricks mediante la extensión de Databricks para Visual Studio Code:
- Inicie Visual Studio Code.
- En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
- Haga clic en Crear un proyecto de Databricks.
- En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de autenticación para la extensión de Databricks para Visual Studio Code.
- En Proporcionar una ruta de acceso a una carpeta en la que quiere que esté el nuevo proyecto, escriba la ruta de acceso a una carpeta en el equipo de desarrollo local donde quiera crear el proyecto o haga clic en el cuadro de diálogo Abrir selección de carpetas y seleccione la ruta de acceso a la carpeta del proyecto.
- En Plantilla que se va a usar en la vista de inicialización del proyecto de Databricks, use las flechas arriba y abajo para seleccionar una plantilla de proyecto y presione Entrar. Para obtener información sobre las plantillas de proyecto de agrupaciones de Databricks, consulta Plantillas de proyecto de agrupación de recursos de Databricks.
- Para el proyecto, escriba un Nombre único para este proyecto o deje el nombre de proyecto predeterminado de
my_project
y luego presione Entrar. - Elija si quiere agregar un cuaderno de código auxiliar (ejemplo), una canalización de Delta Live Tables (ejemplo) o un paquete de Python de código auxiliar (ejemplo) al proyecto, o cualquier combinación de estos códigos auxiliares (ejemplos).
- Presione cualquier tecla para cerrar la pestaña del editor Inicialización del proyecto de Databricks.
- En Seleccionar el proyecto que quiere abrir, elija el proyecto que acaba de crear.
Migración de un proyecto a un proyecto de Databricks
Si tiene un proyecto existente que quiere migrar a un proyecto de Databricks, ábralo con la extensión de Databricks para Visual Studio Code a fin de comenzar la migración:
- Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta y vaya al proyecto para abrirlo.
- En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
- Haga clic en Migrar a un proyecto de Databricks.
- En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de autenticación para la extensión de Databricks para Visual Studio Code.
Nota:
Si abre un proyecto creado con la extensión de Databricks para Visual Studio Code v1, la migración se intentará automáticamente mediante la configuración de área de trabajo y autenticación existente del proyecto. El botón de migración solo está disponible si se produce un error en la migración automática.
Apertura de un proyecto existente de Agrupaciones de recursos de Databricks
Si la extensión de Databricks para Visual Studio Code detecta más de un proyecto de Agrupaciones de recursos de Databricks en la carpeta actual, la extensión de Databricks para Visual Studio Code le permite elegir qué proyecto se va a abrir.
Nota:
Un proyecto de Agrupaciones de recursos de Databricks tiene un archivo databricks.yml
en la carpeta raíz del proyecto. Consulta Configuración de agrupaciones de recursos de Databricks.
Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta y vaya al directorio que contiene el proyecto de agrupación.
En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
Haga clic en Abrir proyecto de Databricks existente.
En la Paleta de comandos, seleccione el proyecto de Agrupaciones de recursos de Databricks existente.
En la Paleta de comandos, seleccione un host y un método de autenticación para el proyecto. Consulte Configuración de autenticación para la extensión de Databricks para Visual Studio Code.
Incorporación de otro proyecto de Databricks al área de trabajo
La extensión de Databricks para Visual Studio Code permite tener varios proyectos de Databricks en el área de trabajo de Visual Studio Code y cambiar fácilmente entre ellos. Para añadir otro proyecto, haga lo siguiente:
Inicie Visual Studio Code. En el menú principal, haga clic en Archivo>Abrir carpeta al área de trabajo y vaya al directorio que contiene el otro proyecto de agrupación.
En la barra lateral de Visual Studio Code, haga clic en el icono Databricks para abrir la extensión.
Haga clic en la carpeta Área de trabajo activa a fin de seleccionar el proyecto que se va a usar para la extensión.