DBeaver-Integration in Azure Databricks
Hinweis
Dieser Artikel behandelt DBeaver, das von Databricks weder bereitgestellt noch unterstützt wird. Informationen zum Kontaktieren des Anbieters finden Sie auf der Seite Issues des dbeaver/dbeaver-Repositorys auf GitHub.
DBeaver ist ein lokales, plattformübergreifendes Datenbanktool für Entwickler, Datenbankadministratoren, Datenanalysten, technische Fachkräfte für Daten und andere, die mit Datenbanken arbeiten müssen. DBeaver unterstützt Azure Databricks sowie andere gängige Datenbanken.
In diesem Artikel wird beschrieben, wie Sie ihren lokalen Entwicklungscomputer zum Installieren, Konfigurieren und Verwenden der kostenlosen Open Source-DBeaver Community Edition (CE) verwenden, um in Azure Databricks mit Datenbanken zu arbeiten.
Hinweis
Dieser Artikel wurde mit macOS, dem Databricks-JDBC-Treiber Version 2.6.36 und DBeaver CE Version 23.3.0 getestet.
Anforderungen
Vor der Installation von DBeaver muss Ihr lokaler Entwicklungscomputer die folgenden Anforderungen erfüllen:
- Ein Linux-64-Bit-, macOS- oder Windows 64-Bit-Betriebssystem. (Linux 32-Bit wird unterstützt, aber nicht empfohlen.)
- Der Databricks JDBC-Treiber auf Ihrem lokalen Entwicklungscomputer und die
DatabricksJDBC42.jar
-Datei aus der heruntergeladenenDatabricksJDBC42-<version>.zip
-Datei extrahiert.
Außerdem benötigen Sie einen Azure Databricks-Cluster oder ein SQL-Warehouse, um eine Verbindung mit DBeaver herzustellen.
Schritt 1: Installieren von DBeaver
Laden Sie die DBeaver CE wie folgt herunter, und installieren Sie sie:
- Linux: Laden Sie eines der Linux-Installationsprogramme von der Downloadseite auf der DBeaver-Website herunter, und führen Sie es aus.
snap
- undflatpak
-Installationsoptionen werden auch auf dieser Seite bereitgestellt. - macOS: Verwenden Sie Homebrew zum Ausführen von
brew install --cask dbeaver-community
, oder verwenden Sie MacPorts, umsudo port install dbeaver-community
auszuführen. Ein macOS-Installationsprogramm ist auch auf der Downloadseite der DBeaver-Website verfügbar. - Windows: Verwenden Sie Chocolatey, um
choco install dbeaver
auszuführen. Ein Windows-Installationsprogramm ist auch auf der Downloadseite der DBeaver-Website verfügbar.
Schritt 2: Konfigurieren des Azure Databricks-JDBC-Treibers für DBeaver
Richten Sie DBeaver mit Informationen zum Databricks JDBC-Treiber ein, den Sie zuvor heruntergeladen haben.
- Starten Sie DBeaver.
- Wenn Sie aufgefordert werden, eine neue Datenbank zu erstellen, klicken Sie auf No (Nein).
- Wenn Sie aufgefordert werden, eine Verbindung mit einer Datenbank herzustellen oder eine Datenbank auszuwählen, klicken Sie auf Cancel (Abbrechen).
- Klicken Sie auf Database > Driver Manager (Datenbank -> Treiber-Manager).
- Klicken Sie im Dialogfeld Driver Manager (Treiber-Manager) auf New (Neu).
- Klicken Sie im Dialogfeld Create new driver (Neuen Treiber erstellen) auf die Registerkarte Libraries (Bibliotheken).
- Klicken Sie auf Datei hinzufügen.
- Navigieren Sie zu dem Ordner, in den Sie den Azure Databricks-JDBC-Treiber extrahiert haben.
- Gehen Sie eine Ebene tiefer, um die Datei
.jar
zu finden. - Markieren Sie die Datei
.jar
, und klicken Sie auf die Schaltfläche Öffnen. - Geben Sie auf der Registerkarte Settings (Einstellungen) unter Driver Name (Treibername)
Databricks
ein. - Geben Sie auf der Registerkarte Settings (Einstellungen) unter Class Name (Klassenname)
com.databricks.client.jdbc.Driver
ein. - Klicken Sie auf OK.
- Klicken Sie im Dialogfeld Driver Manager (Treiber-Manager) auf Close (Schließen).
Schritt 3: Herstellen der Verbindung von DBeaver mit Ihren Azure Databricks-Datenbanken
Verwenden Sie DBeaver, um eine Verbindung mit dem Cluster oder SQL-Warehouse herzustellen, um auf die Datenbanken in Ihrem Azure Databricks-Arbeitsbereich zuzugreifen.
Klicken Sie in DBeaver auf Database > New Database Connection (Datenbank -> Neue Datenbankverbindung).
Klicken Sie im Dialogfeld Connect to a database (Mit einer Datenbank verbinden) auf der Registerkarte All (Alle) auf Databricks und dann auf Next (Weiter).
Wählen Sie die Hauptregisterkarte aus, und geben Sie in das Feld JDBC-URL einen Wert für Ihre Azure Databricks-Ressource ein. Informationen zur JDBC-URL-Feldsyntax finden Sie unter Authentifizierungseinstellungen für den Databricks JDBC-Treiber.
Klicken Sie auf Verbindung testen.
Tipp
Starten Sie Ihre Azure Databricks-Ressource, bevor Sie Ihre Verbindung testen. Andernfalls kann es einige Minuten dauern, bis der Test abgeschlossen ist, während die Ressource gestartet wird.
Wenn die Verbindung erfolgreich hergestellt wurde, klicken Sie im Dialogfeld Connection Test (Verbindungstest) auf OK.
Klicken Sie im Dialogfeld Connect to a database (Mit einer Datenbank verbinden) auf Finish (Fertig stellen).
Im Fenster Database Navigator (Datenbanknavigator) wird ein Databricks-Eintrag angezeigt. So ändern Sie den Namen der Verbindung, um die Identifizierung zu vereinfachen:
- Klicken Sie mit der rechten Maustaste auf Databricks dann auf Edit Connection (Verbindung bearbeiten).
- Klicken Sie im Dialogfeld Connection configuration (Verbindungskonfiguration) auf General (Allgemein).
- Ersetzen Sie Connection name (Verbindungsname) durch
Databricks
mit einem anderen Namen für die Verbindung. - Klicken Sie auf OK.
Wiederholen Sie die Anweisungen in diesem Schritt für jede Ressource, auf die DBeaver zugreifen soll.
Schritt 4: Verwenden von DBeaver zum Durchsuchen von Datenobjekten
Verwenden Sie DBeaver, um auf Datenobjekte in Ihrem Azure Databricks-Arbeitsbereich zuzugreifen, z. B. Tabellen und Tabelleneigenschaften, Sichten, Indizes, Datentypen und andere Datenobjekttypen.
Klicken Sie in DBeaver im Fenster Database Navigator (Datenbanknavigator) mit der rechten Maustaste auf die Verbindung, die Sie verwenden möchten.
Wenn Connect (Verbinden) aktiviert ist, klicken Sie darauf. (Wenn Connect (Verbinden) deaktiviert ist, sind Sie bereits verbunden.)
Tipp
Starten Sie Ihre Ressource, bevor Sie versuchen, eine Verbindung damit herzustellen. Andernfalls kann es einige Minuten dauern, bis die Verbindung besteht, während die Ressource gestartet wird.
Erweitern Sie die Verbindung, die Sie gerade hergestellt haben.
Erweitern und durchsuchen Sie verfügbare Datenobjekte. Doppelklicken Sie auf ein Datenobjekt, um weitere Informationen dazu abzurufen.
Wiederholen Sie die Anweisungen in diesem Schritt, um auf zusätzliche Datenobjekte zuzugreifen.
Schritt 5: Verwenden von DBeaver zum Ausführen von SQL-Anweisungen
Verwenden Sie DBeaver, um die Beispieltabelle trips
aus dem Schema nyctaxi
des Katalogs samples
zu laden.
Klicken Sie in DBeaver im Fenster Database Navigator (Datenbanknavigator) mit der rechten Maustaste auf die Verbindung, die Sie verwenden möchten.
Wenn Connect (Verbinden) aktiviert ist, klicken Sie darauf. (Wenn Connect (Verbinden) deaktiviert ist, sind Sie bereits verbunden.)
Tipp
Starten Sie Ihre Ressource, bevor Sie versuchen, eine Verbindung damit herzustellen. Andernfalls kann es einige Minuten dauern, bis die Verbindung besteht, während die Ressource gestartet wird.
Klicken Sie auf SQL Editor > New SQL Script (SQL-Editor -> Neues SQL-Skript).
Geben Sie auf der Registerkarte (Verbindungsname) Script-1 diese SQL-Anweisung ein:
SELECT * FROM samples.nyctaxi.trips;
Wählen Sie SQL-Editor > SQL-Anweisung ausführen aus.
Nächste Schritte
- Verwenden Sie den Database object editor (Datenbankobjekt-Editor), um mit Datenbankobjekt-Eigenschaften, Daten und Entitätsbeziehungsdiagrammen zu arbeiten.
- Verwenden Sie den Data Editor (Daten-Editor), um Daten in einer Datenbanktabelle oder -sicht anzuzeigen und zu bearbeiten.
- Verwenden Sie den SQL Editor (SQL-Editor), um mit SQL-Skripts zu arbeiten.
- Arbeiten Sie mit Entitätsbeziehungsdiagrammen (Entity Relation Diagrams, ERDs) in DBeaver.
- Importieren und Exportieren von Daten in und aus DBeaver.
- Migrieren von Daten mit DBeaver.
- Behandeln von Problemen mit dem JDBC-Treiber mit DBeaver.