Freigeben über


Entwicklungstools

Databricks bietet ein Ökosystem von Tools, mit denen Sie Anwendungen und Lösungen entwickeln können, die in Azure Databricks integriert werden und Databricks-Ressourcen und -Daten programmgesteuert verwalten.

Dieser Artikel enthält eine Übersicht über diese Tools und Empfehlungen für die besten Tools für gängige Entwicklerszenarien.

Welche Tools bietet Databricks für Entwickler?

Die folgende Tabelle enthält eine Liste der Entwicklertools, die von Databricks bereitgestellt werden.

Tool Beschreibung
Authentifizierung und Autorisierung Konfigurieren Sie die Authentifizierung und Autorisierung für Ihre Tools, Skripts und Apps für die Arbeit mit Azure Databricks.
Databricks Connect Stellen Sie eine Verbindung mit Azure Databricks mithilfe beliebter integrierter Entwicklungsumgebungen (IDEs) wie PyCharm, IntelliJ IDEA, Eclipse, RStudio und JupyterLab her.

Wenn Sie Visual Studio Code verwenden, empfiehlt Databricks die Databricks-Erweiterung für Visual Studio Code, die auf Databricks Connect basiert, da sie zusätzliche Features bietet, um eine einfachere Konfiguration zu ermöglichen.
Databricks-Erweiterung für Visual Studio Code Stellen Sie eine Verbindung mit Ihren Azure Databricks-Remotearbeitsbereichen aus der integrierten Entwicklungsumgebung (IDE) von Visual Studio Code her.
PyCharm Databricks-Plug-In Konfigurieren Sie eine Verbindung mit einem Remote-Databricks-Arbeitsbereich und führen Sie Dateien auf Databricks-Clustern aus PyCharm aus. Dieses Plug-In wird von JetBrains in Partnerschaft mit Databricks entwickelt und bereitgestellt.
Databricks SDKs Automatisieren Sie Azure Databricks aus Codebibliotheken, die für beliebte Sprachen wie Python, Java, Go und R geschrieben wurden. Anstatt REST-API-Aufrufe direkt mit curl/ Postman zu senden, können Sie ein SDK verwenden, um mit Databricks mit einer Programmiersprache Ihrer Wahl zu interagieren.
SQL-Treiber und Tools Stellen Sie eine Verbindung mit Azure Databricks her, um SQL-Befehle und -Skripts auszuführen, programmgesteuert mit Azure Databricks zu interagieren und Azure Databricks SQL-Funktionen in Anwendungen zu integrieren, die in gängigen Sprachen wie Python, Go, JavaScript und TypeScript geschrieben sind.
Databricks-Befehlszeilenschnittstelle Greifen Sie auf die Azure Databricks-Funktionalitäten mithilfe der Databricks -Befehlszeilenschnittstelle (Command-Line Interface, CLI) zu. Die CLI umschließt die Databricks-REST-API. Statt REST-API-Aufrufe direkt mithilfe von Curl oder Postman zu senden, können Sie die Databricks CLI verwenden, um mit Databricks zu interagieren.
Databricks-Ressourcenbundles Implementieren Sie bewährte Methoden für die branchenübliche Entwicklung, Tests und Bereitstellung (CI/CD) für Ihre Azure Databricks-Daten und KI-Projekte mithilfe von Databricks Asset Bundles (DABs).
Databricks Terraform Provider und Terraform CDKTF für Databricks Bereitstellen von Azure Databricks-Infrastruktur und -Ressourcen mithilfe von Terraform.
Pulumi Databricks-Ressourcenanbieter Bereitstellen von Azure Databricks-Infrastruktur und -Ressourcen mithilfe von Pulumi infrastructure-as-Code (IaC).
CI/CD-Tools Integrieren Sie beliebte CI/CD-Systeme und Frameworks wie GitHub Actions, Jenkins und Apache Airflow.

Tipp

Sie können auch viele beliebte andere Tools von Drittanbietern mit Clustern und SQL-Warehouses verbinden, um auf Daten in Azure Databricks zuzugreifen. Siehe Technologiepartner.

Welches Entwicklertool sollte ich verwenden?

Die folgende Tabelle enthält Empfehlungen für Databricks-Tools für allgemeine Entwicklerszenarien.

Szenarien Empfehlung
– Interaktive Entwicklung und Debugging aus einer lokalen IDE Databricks-Erweiterung für Visual Studio Code

PyCharm Databricks-Plug-In

Verwenden Sie für andere IDEs Databricks CLI mit Databricks Connect
- Direkte Interaktion mit Databricks über die Befehlszeile
- Shellskripting
-Experimentieren
– Direktes Aufrufen der REST-API
– Verwalten von lokalen Authentifizierungsprofilen
– Synchronisieren von Code aus der IDE mit dem Databricks-Arbeitsbereich
Databricks-Befehlszeilenschnittstelle
– Verwalten von Workflows und Bereitstellen von Projekten in Databricks
- Bewährte Methoden für CI/CD anwenden
– Gemeinsame Version, gemeinsame Dokumenterstellung, gemeinsame Bereitstellung Ihrer Ressourcen und Ressourcen als eine Einheit
– Unterstützt die am häufigsten verwendeten Ressourcen
Databricks Asset Bundles (ein Feature der CLI)
- Infrastruktur als Code, CI/CD
– Verwalten und Erstellen von Arbeitsbereichen, Katalogen, Metaspeichern und Erzwingen von Berechtigungen
- Gewährleistung der Portabilität der Umgebung und Notfallwiederherstellung
- Viele unterstützte Ressourcen
Databricks-Terraform-Anbieter
- Anwendungsentwicklung
– Integration in vorhandene Bereitstellungssysteme
- Erstellen von benutzerdefinierten Databricks-Workflows und neuen Webdiensten
Databricks Python SDK

Databricks Java SDK

Databricks Go SDK

Databricks R SDK
– Nur erweiterte Szenarien
- Fast alle Databricks-Ressourcen sind verfügbar
Databricks-REST-API