Freigeben über


Einstellungen für Treiberfunktionen für den Databricks ODBC-Treiber

In diesem Artikel wird beschrieben, wie Sie spezielle und erweiterte Einstellungen für Treiberfunktionen für den Databricks ODBC-Treiber konfigurieren.

Der Databricks-ODBC-Treiber stellt die folgenden speziellen und erweiterten Einstellungen für Treiberfunktionen bereit.

Festlegen des Anfangsschemas in ODBC

Mithilfe des ODBC-Treibers können Sie das Schema angeben, indem Sie Schema=<schema-name> als Verbindungskonfiguration festlegen. Dies entspricht der Ausführung von USE <schema-name>.

Unterstützung für ANSI SQL-92-Abfragen in ODBC

Der ODBC-Treiber akzeptiert SQL-Abfragen im ANSI SQL-92-Dialekt und übersetzt sie in den SQL-Dialekt von Databricks. Generiert Ihre Anwendung jedoch direkt die SQL-Syntax von Databricks oder verwendet Ihre Anwendung eine andere SQL-Standardsyntax, die für Azure Databricks spezifisch ist (nicht ANSI SQL-92), wird von Databricks empfohlen, UseNativeQuery=1 als Verbindungskonfiguration festzulegen. Mit dieser Einstellung übergibt der Treiber die SQL-Abfragen im Wortlaut an Azure Databricks.

Extrahieren umfangreicher Abfrageergebnisse in ODBC

Verwenden Sie die neueste Version des ODBC-Treibers mit den folgenden Optimierungen, um beim Extrahieren umfangreicher Abfrageergebnisse die beste Leistung zu erzielen.

Arrow-Serialisierung in ODBC

Ab Version 2.6.15 unterstützt der ODBC-Treiber ein optimiertes Serialisierungsformat für Abfrageergebnisse, das Apache Arrow verwendet.

Cloud Fetch in ODBC

Ab Version 2.6.17 unterstützt der ODBC-Treiber Cloud Fetch, eine Funktion zum Abrufen von Abfrageergebnissen über den Cloudspeicher, der in Ihrer Azure Databricks-Bereitstellung eingerichtet ist.

Die Abfrageergebnisse werden als in Arrow serialisierte Dateien bis zu einer Größe von 20 MB an einen internen DBFS-Speicherort hochgeladen. Sendet der Treiber nach Abschluss der Abfrage Abrufanforderungen, generiert Azure Databricks Shared Access Signatures und gibt diese an die hochgeladenen Dateien zurück. Der ODBC-Treiber verwendet dann die URLs, um die Ergebnisse direkt aus DBFS herunterzuladen.

Cloud Fetch wird nur für Abfrageergebnisse größer als 1 MB verwendet. Weniger umfangreiche Ergebnisse werden direkt aus Azure Databricks abgerufen.

Azure Databricks sammelt die kumulierten Dateien für die automatische Speicherbereinigung und markiert sie zur Löschung nach 24 Stunden. Nach weiteren 24 Stunden werden die markierten Dateien vollständig gelöscht.

Weitere Informationen zur Cloud Fetch-Architektur finden Sie unter How We Achieved High-bandwidth Connectivity With BI Tools (Erreichen von Konnektivität mit hoher Bandbreite mithilfe von BI-Tools).

Aktivieren der Protokollierung

Legen Sie zum Aktivieren der Protokollierung im ODBC-Treiber für Windows die folgenden Felder im ODBC-Datenquellenadministrator für den zugehörigen DSN fest:

  • Legen Sie das Feld Protokollstufe auf einen Wert zwischen SCHWERWIEGEND (Protokollierung nur von schwerwiegenden Ereignissen) und ABLAUFVERFOLGUNG (Protokollierung aller Treiberaktivitäten) fest.
  • Legen Sie das Feld Protokollpfad auf den vollständigen Pfad zu dem Ordner fest, in dem Protokolldateien gespeichert werden sollen.
  • Legen Sie das Feld Max. Dateianzahl auf die maximale Anzahl von Protokolldateien fest, die beibehalten werden sollen.
  • Legen Sie das Feld Max. Dateigröße auf die maximale Größe der einzelnen Protokolldateien in Megabyte fest.

Um die Protokollierung im ODBC-Treiber für einen Nicht-Windows-Computer zu aktivieren, legen Sie die folgenden Eigenschaften in der zugehörigen DSN-Zeichenfolge oder der DSN-losen Verbindungszeichenfolge fest:

  • Legen Sie die Eigenschaft LogLevel auf einen Wert zwischen 1 (Protokollierung nur von schwerwiegenden Ereignissen) und 6 (Protokollierung aller Treiberaktivitäten) fest.
  • Legen Sie die LogPath-Eigenschaft auf den vollständigen Pfad zu dem Ordner fest, in dem Protokolldateien gespeichert werden sollen.
  • Legen Sie die Eigenschaft LogFileCount auf die maximale Anzahl von Protokolldateien fest, die beibehalten werden sollen.
  • Legen Sie die Eigenschaft LogFileSize auf die maximale Größe der einzelnen Protokolldateien in Byte fest.

Weitere Informationen finden Sie in den Abschnitten Configuring Logging Options on Windows und Configuring Logging Options on a Non-Windows Machine im Leitfaden zum Databricks JDBC-Treiber.