Delen via


Instellingen voor stuurprogrammamogelijkheden voor het Databricks JDBC-stuurprogramma

In dit artikel wordt beschreven hoe u speciale en geavanceerde instellingen voor stuurprogrammamogelijkheden configureert voor het Databricks JDBC-stuurprogramma.

Het Databricks JDBC-stuurprogramma biedt de volgende speciale en geavanceerde instellingen voor stuurprogrammamogelijkheden.

ANSI SQL-92-queryondersteuning in JDBC

Verouderde Spark JDBC-stuurprogramma's accepteren SQL-query's in ANSI SQL-92 dialect en vertalen de query's naar het Databricks SQL-dialect voordat ze naar de server worden verzonden. Als uw toepassing echter rechtstreeks Databricks SQL genereert of als uw toepassing gebruikmaakt van een niet-ANSI SQL-92-standaardsyntaxis die specifiek is voor Azure Databricks, raadt Databricks u aan om in te stellen UseNativeQuery=1 als een verbindingsconfiguratie. Met deze instelling geeft het stuurprogramma de SQL-query's letterlijk door aan Azure Databricks.

Standaardcatalogus en schema

Als u de standaardcatalogus en het standaardschema wilt opgeven, voegt u deze toe ConnCatalog=<catalog-name>;ConnSchema=<schema-name> aan de JDBC-verbindings-URL.

Grote queryresultaten extraheren in JDBC

Als u de beste prestaties wilt behalen wanneer u grote queryresultaten extraheert, gebruikt u de nieuwste versie van het JDBC-stuurprogramma, waaronder de volgende optimalisaties.

Pijlserialisatie in JDBC

JDBC-stuurprogrammaversie 2.6.16 en hoger ondersteunt een geoptimaliseerde serialisatie-indeling voor queryresultaten die gebruikmaakt van Apache Arrow.

Cloud ophalen in JDBC

Het JDBC-stuurprogramma versie 2.6.19 en hoger ondersteunt Cloud Fetch, een mogelijkheid waarmee queryresultaten worden opgehaald via de cloudopslag die is ingesteld in uw Azure Databricks-implementatie.

Queryresultaten worden geĆ¼pload naar een interne DBFS-opslaglocatie als met pijl geserialiseerde bestanden van maximaal 20 MB. Wanneer het stuurprogramma ophaalaanvragen verzendt nadat de query is voltooid, genereert en retourneert Azure Databricks handtekeningen voor gedeelde toegang naar de geĆ¼ploade bestanden. Het JDBC-stuurprogramma gebruikt vervolgens de URL's om de resultaten rechtstreeks vanuit DBFS te downloaden.

Cloud fetch wordt alleen gebruikt voor queryresultaten die groter zijn dan 1 MB. Kleinere resultaten worden rechtstreeks opgehaald uit Azure Databricks.

Azure Databricks verzamelt automatisch de verzamelde bestanden die na 24 uur zijn gemarkeerd voor verwijdering. Deze gemarkeerde bestanden worden na 24 uur volledig verwijderd.

Zie How We Achieved High Bandwidth Connectivity With BI Tools (Connectiviteit met hoge bandbreedte met BI-hulpprogramma's) voor meer informatie over de architectuur voor cloud ophalen.

Logboekregistratie inschakelen

Als u logboekregistratie in het JDBC-stuurprogramma wilt inschakelen, stelt u de LogLevel eigenschap in van 1 waaruit alleen ernstige gebeurtenissen 6 moeten worden geregistreerd om alle activiteit van het stuurprogramma te registreren. Stel de LogPath eigenschap in op het volledige pad naar de map waarin u logboekbestanden wilt opslaan.

Zie de Configuring Logging sectie in de Handleiding voor Databricks JDBC-stuurprogramma's voor meer informatie.