Compartir vía


Herramientas de desarrollo

Databricks proporciona un ecosistema de herramientas para ayudarle a desarrollar aplicaciones y soluciones que se integran con Azure Databricks y administran mediante programación los recursos y los datos de Databricks.

En este artículo se proporciona información general sobre estas herramientas y recomendaciones para las mejores herramientas para escenarios comunes para desarrolladores.

¿Qué herramientas proporciona Databricks a los desarrolladores?

En la tabla siguiente se proporciona una lista de las herramientas de desarrollo proporcionadas por Databricks.

Herramienta Descripción
Autenticación y autorización Configure la autenticación y autorización para que las herramientas, scripts y aplicaciones funcionen con Azure Databricks.
Conexión de Databricks Conéctese a Azure Databricks mediante entornos de desarrollo integrados (IDE) populares, como PyCharm, IntelliJ IDEA, Eclipse, RStudio y JupyterLab.

Si usa Visual Studio Code, Databricks recomienda la extensión de Databricks para Visual Studio Code, que se basa en Databricks Connect, ya que proporciona características adicionales para facilitar la configuración.
Extensión de Databricks para Visual Studio Code Conéctese a las áreas de trabajo remotas de Azure Databricks desde el entorno de desarrollo integrado (IDE) de Visual Studio Code .
Complemento PyCharm Databricks Configure una conexión a un área de trabajo remota de Databricks y ejecute archivos en clústeres de Databricks desde PyCharm. Este complemento es desarrollado y proporcionado por JetBrains en colaboración con Databricks.
SDK de Databricks Automatice Azure Databricks desde bibliotecas de código escritas para lenguajes populares, como Python, Java, Go y R. En lugar de enviar llamadas a la API REST directamente mediante curl/ Postman, puede usar un SDK para interactuar con Databricks mediante un lenguaje de programación que prefiera.
Herramientas y drivers de SQL Conéctese a Azure Databricks para ejecutar secuencias de comandos y comandos SQL, interactuar mediante programación con Azure Databricks e integrar la funcionalidad de SQL de Azure Databricks en aplicaciones escritas en lenguajes populares, como Python, Go, JavaScript y TypeScript.
CLI de Databricks Acceda a la funcionalidad de Azure Databricks mediante la interfaz de la línea de comandos (CLI) de Databricks. La CLI encapsula la API REST de Databricks, por lo que, en lugar de enviar llamadas a la API REST directamente mediante curl o Postman, puede usar la CLI de Databricks para interactuar con Databricks.
Conjuntos de recursos de Databricks Implemente procedimientos recomendados de desarrollo, pruebas e implementación (CI/CD) estándar del sector para los proyectos de inteligencia artificial y datos de Azure Databricks mediante Databricks Asset Bundles (DAB).
Proveedor de Terraform de Databricks y CDKTF de Terraform para Databricks Aprovisione la infraestructura y los recursos de Azure Databricks mediante Terraform.
Herramientas de CI/CD Integre sistemas y marcos de CI/CD populares, como Acciones de GitHub, Jenkins y Apache Airflow.

Sugerencia

Puede conectar también numerosas herramientas conocidas adicionales de terceros a clústeres y almacenes de SQL para acceder a los datos de Azure Databricks. Consulte Partners de tecnología.

¿Qué herramienta de desarrollador debo usar?

En la tabla siguiente se describen las recomendaciones de herramientas de Databricks para escenarios comunes para desarrolladores.

Escenarios Recomendación
- Desarrollo interactivo y depuración desde un IDE local Extensión de Databricks para Visual Studio Code

Complemento PyCharm Databricks

Para otros IDE, use la CLI de Databricks con Databricks Connect.
- Interacción directa con Databricks desde la línea de comandos
- Scripting de shell
-Experimentación
- Invocación de la API REST directamente
- Administrar perfiles de autenticación local
- Sincronización de código desde el IDE al área de trabajo de Databricks
CLI de Databricks
- Administración de flujos de trabajo e implementación de proyectos en Databricks
- Aplicar procedimientos recomendados de CI/CD
- Co-version, co-author, co-deploy your resources and assets as one unit
: admite los recursos más comunes.
Conjuntos de recursos de Databricks (una característica de la CLI)
- Infraestructura como código, CI/CD
- Administrar y crear áreas de trabajo, catálogos, metastores y aplicar permisos
- Garantizar la portabilidad del entorno y la recuperación ante desastres
- Muchos recursos admitidos
Proveedor Databricks Terraform
- Desarrollo de aplicaciones
- Integración con sistemas de implementación existentes
- Creación de flujos de trabajo personalizados de Databricks y nuevos servicios web
Databricks Python SDK

Databricks Java SDK

Databricks Go SDK

Databricks R SDK
- Solo escenarios avanzados
- Casi todos los recursos de Databricks están disponibles
API REST de Databricks