Condividi tramite


Integrazione di DBeaver con Azure Databricks

Nota

Questo articolo illustra DBeaver, sviluppato da terze parti. Per contattare il provider, vedere la pagina segnalazioni del repository dbeaver/dbeaver su GitHub.

DBeaver è uno strumento di database locale multipiattaforma per sviluppatori, amministratori di database, analisti dei dati, data engineer e altri utenti che devono lavorare con i database. DBeaver supporta Azure Databricks e altri database più diffusi.

Questo articolo descrive come usare il computer di sviluppo locale per installare, configurare e usare il DBeaver Community Edition (CE) gratuito e open source per lavorare con i database in Azure Databricks.

Nota

Questo articolo è stato testato con macOS, Databricks JDBC Driver versione 2.6.36 e DBeaver CE versione 23.3.0.

Requisiti

Prima di installare DBeaver, il computer di sviluppo locale deve soddisfare i requisiti seguenti:

  • Un sistema operativo Linux a 64 bit, macOS o Windows a 64 bit. (Linux a 32 bit è supportato ma non consigliato).
  • Scaricare il driver JDBC Databricks sul computer di sviluppo locale, estraendo il file DatabricksJDBC42.jar dal file DatabricksJDBC42-<version>.zip scaricato.

Per connettersi a DBeaver, è anche necessario disporre di un cluster o un warehouse SQL .

Passaggio 1: Installare DBeaver

Scaricare e installare DBeaver CE come indicato di seguito:

  • Linux: Scarica ed esegui uno dei programmi di installazione di Linux dalla pagina Download sul sito Web di DBeaver. Le opzioni di installazione snap e flatpak sono disponibili anche in questa pagina.
  • macOS: usare Homebrew per eseguire brew install --cask dbeaver-communityoppure usare MacPorts per eseguire sudo port install dbeaver-community. Un programma di installazione di macOS è disponibile anche nella pagina Download nel sito Web di DBeaver.
  • Windows: utilizzare Chocolatey per eseguire choco install dbeaver. Un programma di installazione di Windows è disponibile anche nella pagina download del sito Web DBeaver.

Passaggio 2: Configurare il driver JDBC di Azure Databricks per DBeaver

Configurare DBeaver con informazioni sul driver JDBC di Databricks scaricato in precedenza.

  1. Avvia DBeaver.
  2. Se viene richiesto di creare un nuovo database, fare clic su No.
  3. Se viene richiesto di connettersi o selezionare un database, fare clic su Annulla.
  4. Fare clic su Gestione driver > database .
  5. Nella finestra di dialogo Gestione driver fare clic su Nuovo.
  6. Nella finestra di dialogo Crea nuovo driver, fare clic sulla scheda Librerie.
  7. Fare clic su Aggiungi file.
  8. Passare alla cartella in cui è stato estratto il driver JDBC di Azure Databricks.
  9. Passare a un livello inferiore per trovare il file .jar.
  10. Evidenziare il file di .jar e fare clic su Apri.
  11. Nella scheda Impostazioni, immettere per Databricks.
  12. Nella scheda Impostazioni di per Nome classeimmettere .
  13. Fare clic su OK.
  14. Nella finestra di dialogo Gestione Driver, fare clic su Chiudi.

Passaggio 3: Connettere DBeaver ai database di Azure Databricks

Usare DBeaver per connettersi al cluster o a SQL Warehouse per accedere ai database nell'area di lavoro di Azure Databricks.

  1. In DBeaver, fare clic su Database > Nuova connessione al database.

  2. Nella finestra di dialogo Connetti a un database, nella scheda Tutti, fare clic su Databricks, quindi fare clic su Avanti.

  3. Fare clic sulla scheda principale e immettere un valore nel campo URL JDBC per la risorsa di Azure Databricks. Per la sintassi del campo URL JDBC, vedere Impostazioni di autenticazione per il driver JDBC di Databricks.

  4. Fare clic su Test connessione.

    Suggerimento

    È consigliabile avviare la risorsa di Azure Databricks prima di testare la connessione. In caso contrario, il completamento del test potrebbe richiedere alcuni minuti durante l'avvio della risorsa.

  5. Se la connessione ha esito positivo, nella finestra di dialogo, Test Connessione, cliccare su OK.

  6. Nella finestra di dialogo Connetti a un database fare clic su Fine.

Nella finestra Strumento di navigazione del database viene visualizzata una voce di databricks . Per modificare il nome della connessione per semplificare l'identificazione:

  1. Fare clic con il pulsante destro del mouse su Databricks, quindi scegliere Modifica connessione.
  2. Nella finestra di dialogo Configurazione connessione fare clic su Generale.
  3. Per il nome della connessione , sostituire Databricks con un nome diverso per la connessione.
  4. Fare clic su OK.

Ripetere le istruzioni in questo passaggio per ogni risorsa a cui si vuole che DBeaver acceda.

Passaggio 4: Usare DBeaver per esplorare gli oggetti dati

Usare DBeaver per accedere agli oggetti dati nell'area di lavoro di Azure Databricks, ad esempio tabelle e proprietà di tabella, viste, indici, tipi di dati e altri tipi di oggetto dati.

  1. Nella finestra Database Navigator di DBeaver, fare clic con il pulsante destro del mouse sulla connessione che si desidera utilizzare.

  2. Se Connect è abilitato, fare clic su di esso. Se Connect è disabilitato, si è già connessi.

    Suggerimento

    È consigliabile avviare la risorsa prima di provare a connettersi. In caso contrario, il completamento della connessione potrebbe richiedere alcuni minuti durante l'avvio della risorsa.

  3. Espandi la connessione a cui ti sei appena connesso.

  4. Espandere ed esplorare gli oggetti di dati disponibili. Fare doppio clic su un oggetto dati per ottenere altre informazioni su di esso.

Ripetere le istruzioni in questo passaggio per accedere ad altri oggetti dati.

Passaggio 5: Usare DBeaver per eseguire istruzioni SQL

Usare DBeaver per caricare la tabella di esempio trips dallo schema nyctaxi del catalogo samples.

  1. In DBeaver, nella finestra Database Navigator, fai clic con il pulsante destro del mouse sulla connessione che desideri utilizzare.

  2. Se Connect è abilitato, fare clic su di esso. Se Connect è disabilitato, si è già connessi.

    Suggerimento

    È consigliabile avviare la risorsa prima di provare a connettersi. In caso contrario, il completamento della connessione potrebbe richiedere alcuni minuti durante l'avvio della risorsa.

  3. Fare clic su Editor SQL > Nuovo script SQL.

  4. Nella scheda (nome-connessione) Script-1, immettere questa istruzione SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Fare clic su Editor SQL > Esegui script SQL.

Passaggi successivi

  • Utilizzare l'editor di oggetti di database per lavorare con diagrammi di relazione tra oggetti di database, dati e entità.
  • Utilizzare l'editor di dati per visualizzare e modificare i dati in una tabella o vista di database.
  • Usare l'editor SQL per usare gli script SQL.
  • Usare diagrammi di relazione tra entità (ERD) in DBeaver.
  • Importare ed esportare i dati in DBeaver e da esso.
  • Migrare dati con DBeaver.
  • Risolvere i problemi del driver JDBC con DBeaver.

Risorse aggiuntive