Impostazioni delle funzionalità del driver per il driver JDBC di Databricks
Questo articolo descrive come configurare impostazioni speciali e avanzate delle funzionalità del driver per il driver JDBC di Databricks.
Il driver JDBC di Databricks offre le impostazioni speciali e avanzate seguenti per le funzionalità del driver.
- Supporto delle query ANSI SQL-92 in JDBC
- Catalogo e schema predefiniti
- Estrarre risultati di query di grandi dimensioni in JDBC
- Serializzazione freccia in JDBC
- Recupero cloud in JDBC
- Abilitazione della registrazione
Supporto delle query ANSI SQL-92 in JDBC
I driver JDBC Spark legacy accettano query SQL in dialetto ANSI SQL-92 e convertono le query nel dialetto SQL di Databricks prima di inviarle al server. Tuttavia, se l'applicazione genera direttamente Databricks SQL o l'applicazione usa una sintassi SQL-92 standard non ANSI specifica per Azure Databricks, Databricks consiglia di impostare UseNativeQuery=1
come configurazione di connessione. Con questa impostazione, il driver passa le query SQL verbatim ad Azure Databricks.
Catalogo e schema predefiniti
Per specificare il catalogo e lo schema predefiniti, aggiungere ConnCatalog=<catalog-name>;ConnSchema=<schema-name>
all'URL di connessione JDBC.
Estrarre risultati di query di grandi dimensioni in JDBC
Per ottenere prestazioni ottimali quando si estraggono risultati di query di grandi dimensioni, usare la versione più recente del driver JDBC, che include le ottimizzazioni seguenti.
Serializzazione freccia in JDBC
Il driver JDBC versione 2.6.16 e successive supporta un formato di serializzazione dei risultati delle query ottimizzato che usa Apache Arrow.
Recupero cloud in JDBC
Il driver JDBC versione 2.6.19 e successive supporta Cloud Fetch, una funzionalità che recupera i risultati delle query tramite l'archiviazione cloud configurata nella distribuzione di Azure Databricks.
I risultati delle query vengono caricati in un percorso di archiviazione DBFS interno come file serializzati con freccia fino a 20 MB. Quando il driver invia richieste di recupero dopo il completamento delle query, Azure Databricks genera e restituisce firme di accesso condiviso ai file caricati. Il driver JDBC usa quindi gli URL per scaricare i risultati direttamente da DBFS.
Il recupero cloud viene usato solo per i risultati delle query superiori a 1 MB. I risultati più piccoli vengono recuperati direttamente da Azure Databricks.
Azure Databricks esegue automaticamente il Garbage Collection dei file accumulati contrassegnati per l'eliminazione dopo 24 ore. Questi file contrassegnati vengono eliminati completamente dopo altre 24 ore.
Per altre informazioni sull'architettura di recupero cloud, vedere Come è stata raggiunta la connettività a larghezza di banda elevata con gli strumenti di BUSINESS Intelligence.
Abilitazione della registrazione
Per abilitare la registrazione nel driver JDBC, impostare la LogLevel
proprietà da 1
per registrare solo eventi gravi tramite 6
per registrare tutte le attività del driver. Impostare la LogPath
proprietà sul percorso completo della cartella in cui si desidera salvare i file di log.
Per altre informazioni, consultare la sezione Configuring Logging
nella Guida al driver JDBC di Databricks.