Freigeben über


DataGrip-Integration in Azure Databricks

Hinweis

Dieser Artikel behandelt DataGrip, der von einem Drittanbieter entwickelt wird. Informationen zum Kontaktieren des Anbieters finden Sie unter DataGrip-Support.

DataGrip ist eine integrierte Entwicklungsumgebung (IDE) für Datenbankentwickler, die eine Abfragekonsole, Schemanavigation, Erläuterungspläne, intelligente Codevervollständigung, Echtzeitanalyse und schnelle Fixes, Refactorings, Integration der Versionskontrolle und andere Features bietet.

In diesem Artikel wird beschrieben, wie Sie ihren lokalen Entwicklungscomputer zum Installieren, Konfigurieren und DataGrip verwenden, um in Azure Databricks mit Datenbanken zu arbeiten.

Hinweis

Dieser Artikel wurde mit macOS, dem Databricks-JDBC-Treiber Version 2.6.36 und DataGrip Version 2023.3.1 getestet.

Anforderungen

Vor der Installation von DataGrip muss Ihr lokaler Entwicklungscomputer die folgenden Anforderungen erfüllen:

  • Ein Linux-, macOS- oder Windows-Betriebssystem.
  • Laden Sie den Databricks JDBC-Treiber auf Ihren lokalen Entwicklungscomputer herunter, und extrahieren Sie die DatabricksJDBC42.jar-Datei aus der heruntergeladenen DatabricksJDBC42-<version>.zip-Datei.
  • Ein Azure Databricks-Cluster oder SQL-Warehouse, mit dem eine Verbindung mit DataGrip hergestellt werden soll.

Schritt 1: Installieren von DataGrip

Herunterladen und Installieren von DataGrip

  • Linux: Laden Sie die Datei .zip herunter, extrahieren Sie ihren Inhalt, und befolgen Sie dann die Anweisungen in der Datei Install-Linux-tar.txt.
  • macOS: Laden Sie die Datei .dmg herunter, und führen Sie sie aus.
  • Windows: Laden Sie die Datei .exe herunter, und führen Sie sie aus.

Weitere Informationen finden Sie unter Installieren von DataGrip auf der DataGrip-Website.

Schritt 2: Konfigurieren des Databricks JDBC-Treibers für DataGrip

Richten Sie DataGrip mit Informationen zum Databricks JDBC-Treiber ein, den Sie zuvor heruntergeladen haben.

  1. Starten Sie DataGrip.
  2. Klicken Sie auf Datei > Datenquellen.
  3. Klicken Sie im Dialogfeld Datenquellen und Treiber auf die Registerkarte Treiber.
  4. Klicken Sie auf die Schaltfläche + (Treiber), um einen Treiber hinzuzufügen.
  5. Geben Sie unter NameDatabricks ein.
  6. Klicken Sie auf der Registerkarte Allgemein in der Liste Treiberdateien auf die Schaltfläche + (Hinzufügen).
  7. Klicken Sie auf Benutzerdefinierte JARs.
  8. Navigieren Sie zu der DatabricksJDBC42.jar Datei, die Sie zuvor extrahiert haben, wählen Sie sie aus, und klicken Sie dann auf Öffnen.
  9. Wählen Sie für Klasse die Option com.databricks.client.jdbc.Driver aus.
  10. Klicken Sie auf OK.

Schritt 3: Herstellen der Verbindung von DataGrip mit Ihren Azure Databricks-Datenbanken

  1. Klicken Sie in DataGrip auf Datei > Datenquellen.

  2. Klicken Sie auf der Registerkarte Datenquellen auf die Schaltfläche + (Hinzufügen).

  3. Wählen Sie den Databricks-Treiber aus, den Sie im vorherigen Schritt hinzugefügt haben.

  4. Geben Sie auf der Registerkarte Allgemein für URL den Wert aus dem Feld JDBC-URL für Ihre Azure Databricks-Ressource ein. Informationen zur JDBC-URL-Feldsyntax finden Sie unter Authentifizierungseinstellungen für den Databricks JDBC-Treiber.

    Hinweis

    Die ConnCatalogEinstellung für die Treiberfunktion muss auf der URL DES VORGANGS angegeben werden, andernfalls können keine Schemas identifiziert werden.

  5. Klicken Sie auf Verbindung testen.

    Tipp

    Starten Sie Ihre Ressource, bevor Sie Ihre Verbindung testen. Andernfalls kann es einige Minuten dauern, bis der Test abgeschlossen ist, während die Ressource gestartet wird.

  6. Wenn die Verbindung erfolgreich hergestellt wird, aktivieren Sie auf der Registerkarte Schemas die Kontrollkästchen für die Schemas, auf die Sie Zugriff benötigen, z. B. Alle Schemas.

  7. Klicken Sie auf OK.

Wiederholen Sie die Anweisungen in diesem Schritt für jede Ressource, auf die DataGrip zugreifen soll.

Schritt 4: Durchsuchen von Tabellen mithilfe von DataGrip

Zugreifen auf Tabellen in Ihrem in Ihrem Azure Databricks Arbeitsbereich mithilfe von DataGrip.

  1. Erweitern Sie in DataGrip im Fenster Datenbank Ihren Ressourcenknoten, erweitern Sie das Schema, das Sie durchsuchen möchten, und erweitern Sie dann Tabellen.
  2. Doppelklicken Sie auf eine Tabelle. Die erste Gruppe von Zeilen aus der Tabelle wird angezeigt.

Wiederholen Sie die Anweisungen in diesem Schritt, um auf zusätzliche Tabellen zu zugreifen.

Klicken Sie auf der Symbolleiste des Fensters Datenbank auf das Symbol Datenquelleneigenschaften, um auf Tabellen in anderen Schemas zu zugreifen. Aktivieren Sie im Dialogfeld Datenquellen und Treiber auf der Registerkarte Schemas das Kontrollkästchen für jedes zusätzliche Schema, auf das Sie zugreifen möchten, und klicken Sie dann auf OK.

Schritt 5: Verwenden von DataGrip zum Ausführen von SQL-Anweisungen

Verwenden Sie DataGrip, um die Beispieltabelle trips aus dem Schema samples des Katalogs nyctaxi zu laden.

  1. Wählen Sie in DataGrip Datei > Neu > SQL-Datei aus.

  2. Geben Sie einen Namen für die Datei ein, z. B. select_trips.

  3. Geben Sie auf der Registerkarte der Datei select_trips.sql die folgende SQL-Anweisung ein:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Wählen Sie die SELECT Anweisung aus.

  5. Klicken Sie auf der Symbolleiste der Dateiregisterkarte auf das Symbol Ausführen.

Nächste Schritte

Zusätzliche Ressourcen