Herramientas de desarrollo
Databricks proporciona un ecosistema de herramientas para ayudarle a desarrollar aplicaciones y soluciones que se integran con Azure Databricks y administran mediante programación los recursos y los datos de Databricks.
En este artículo se proporciona información general sobre estas herramientas y recomendaciones para las mejores herramientas para escenarios comunes para desarrolladores.
¿Qué herramientas proporciona Databricks a los desarrolladores?
En la tabla siguiente se proporciona una lista de las herramientas de desarrollo proporcionadas por Databricks.
Herramienta | Descripción |
---|---|
Autenticación y autorización | Configure la autenticación y autorización para que las herramientas, scripts y aplicaciones funcionen con Azure Databricks. |
Conexión de Databricks | Conéctese a Azure Databricks mediante entornos de desarrollo integrados (IDE) populares, como PyCharm, IntelliJ IDEA, Eclipse, RStudio y JupyterLab. Si usa Visual Studio Code, Databricks recomienda la extensión de Databricks para Visual Studio Code, que se basa en Databricks Connect, ya que proporciona características adicionales para facilitar la configuración. |
Extensión de Databricks para Visual Studio Code | Conéctese a las áreas de trabajo remotas de Azure Databricks desde el entorno de desarrollo integrado (IDE) de Visual Studio Code . |
Complemento PyCharm Databricks | Configure una conexión a un área de trabajo remota de Databricks y ejecute archivos en clústeres de Databricks desde PyCharm. Este complemento es desarrollado y proporcionado por JetBrains en colaboración con Databricks. |
SDK de Databricks | Automatice Azure Databricks desde bibliotecas de código escritas para lenguajes populares, como Python, Java, Go y R. En lugar de enviar llamadas a la API REST directamente mediante curl/ Postman, puede usar un SDK para interactuar con Databricks mediante un lenguaje de programación que prefiera. |
Herramientas y drivers de SQL | Conéctese a Azure Databricks para ejecutar secuencias de comandos y comandos SQL, interactuar mediante programación con Azure Databricks e integrar la funcionalidad de SQL de Azure Databricks en aplicaciones escritas en lenguajes populares, como Python, Go, JavaScript y TypeScript. |
CLI de Databricks | Acceda a la funcionalidad de Azure Databricks mediante la interfaz de la línea de comandos (CLI) de Databricks. La CLI encapsula la API REST de Databricks, por lo que, en lugar de enviar llamadas a la API REST directamente mediante curl o Postman, puede usar la CLI de Databricks para interactuar con Databricks. |
Conjuntos de recursos de Databricks | Implemente procedimientos recomendados de desarrollo, pruebas e implementación (CI/CD) estándar del sector para los proyectos de inteligencia artificial y datos de Azure Databricks mediante Databricks Asset Bundles (DAB). |
Proveedor de Terraform de Databricks y CDKTF de Terraform para Databricks | Aprovisione la infraestructura y los recursos de Azure Databricks mediante Terraform. |
Proveedor de recursos Pulumi de Databricks | Aprovisione la infraestructura y los recursos de Azure Databricks mediante la infraestructura como código (IaC) de Pulumi. |
Herramientas de CI/CD | Integre sistemas y marcos de CI/CD populares, como Acciones de GitHub, Jenkins y Apache Airflow. |
Sugerencia
Puede conectar también numerosas herramientas conocidas adicionales de terceros a clústeres y almacenes de SQL para acceder a los datos de Azure Databricks. Consulte Partners de tecnología.
¿Qué herramienta de desarrollador debo usar?
En la tabla siguiente se describen las recomendaciones de herramientas de Databricks para escenarios comunes para desarrolladores.
Escenarios | Recomendación |
---|---|
- Desarrollo interactivo y depuración desde un IDE local | Extensión de Databricks para Visual Studio Code Complemento PyCharm Databricks Para otros IDE, use la CLI de Databricks con Databricks Connect. |
- Interacción directa con Databricks desde la línea de comandos - Scripting de shell -Experimentación - Invocación de la API REST directamente - Administrar perfiles de autenticación local - Sincronización de código desde el IDE al área de trabajo de Databricks |
CLI de Databricks |
- Administración de flujos de trabajo e implementación de proyectos en Databricks - Aplicar procedimientos recomendados de CI/CD - Co-version, co-author, co-deploy your resources and assets as one unit : admite los recursos más comunes. |
Conjuntos de recursos de Databricks (una característica de la CLI) |
- Infraestructura como código, CI/CD - Administrar y crear áreas de trabajo, catálogos, metastores y aplicar permisos - Garantizar la portabilidad del entorno y la recuperación ante desastres - Muchos recursos admitidos |
Proveedor Databricks Terraform |
- Desarrollo de aplicaciones - Integración con sistemas de implementación existentes - Creación de flujos de trabajo personalizados de Databricks y nuevos servicios web |
Databricks Python SDK Databricks Java SDK Databricks Go SDK Databricks R SDK |
- Solo escenarios avanzados - Casi todos los recursos de Databricks están disponibles |
API REST de Databricks |