Compartir a través de


Configuración de capacidad del controlador del controlador ODBC de Databricks

En este artículo se describe cómo configurar opciones de capacidad del controlador especiales y avanzadas para el controlador ODBC de Databricks.

El controlador ODBC de Databricks proporciona la siguiente configuración de capacidad de controlador especial y avanzada.

Establecimiento del esquema inicial en ODBC

El controlador ODBC permite especificar el esquema estableciendo Schema=<schema-name> como una configuración de conexión. Equivale a ejecutar USE <schema-name>.

Compatibilidad con consultas SQL-92 de ANSI en ODBC

El controlador ODBC acepta consultas SQL en el dialecto SQL-92 de ANSI y las traduce al dialecto SQL de Databricks. Sin embargo, si la aplicación genera sintaxis SQL de Databricks directamente o la aplicación usa una sintaxis SQL estándar en el dialecto SQL-92 que no sea ANSI específica de Azure Databricks, Databricks recomienda establecer UseNativeQuery=1 como la configuración de conexión. Con esa configuración, el controlador pasa las consultas SQL textuales a Azure Databricks.

Extracción de resultados de consultas grandes en ODBC

Para lograr el mejor rendimiento al extraer resultados de consultas grandes, use la última versión del controlador ODBC que incluye las siguientes optimizaciones.

Serialización de Arrow en ODBC

La versión 2.6.15 y las versiones posteriores del controlador ODBC admiten un formato de serialización de resultados de consulta optimizado que usa Apache Arrow.

Captura en la nube en ODBC

La versión 2.6.17 y las versiones posteriores del controlador ODBC admiten Cloud Fetch, una funcionalidad que captura los resultados de la consulta mediante el almacenamiento en la nube configurado en la implementación de Azure Databricks.

Los resultados de la consulta se cargan en una ubicación de almacenamiento DBFS interna como archivos serializados por Arrow de hasta 20 MB. Cuando el controlador envía solicitudes de captura después de la finalización de la consulta, Azure Databricks genera y devuelve firmas de acceso compartido a los archivos cargados. A continuación, el controlador ODBC usa las direcciones URL para descargar los resultados directamente desde DBFS.

Cloud Fetch solo se usa para los resultados de consulta de más de 1 MB. Los resultados más pequeños se recuperan directamente de Azure Databricks.

Azure Databricks recopila automáticamente los archivos acumulados que se marcan para su eliminación después de 24 horas. Estos archivos marcados se eliminan completamente después de otras 24 horas.

Para más información sobre la arquitectura de Cloud Fetch, vea Cómo logramos la conectividad de ancho de banda alto con las herramientas de BI.

Habilitar registro

Para habilitar el registro en el controlador ODBC para Windows, establezca los siguientes campos en el administrador de orígenes de datos ODBC para el DSN relacionado:

  • Establezca el campo Nivel de registro de FATAL para registrar solo eventos graves a través de TRACE para registrar toda la actividad del controlador.
  • Establezca el campo Ruta de acceso de registro en la ruta de acceso completa a la carpeta donde desea guardar los archivos de registro.
  • Establezca el campo Número máximo de archivos en el número máximo de archivos de registro que se van a conservar.
  • Establezca el campo Tamaño máximo de archivo en el tamaño máximo de cada archivo de registro en megabytes.

Para habilitar el registro en el controlador ODBC para una máquina que no sea Windows, establezca las siguientes propiedades en la cadena de conexión DSN o DSN relacionada:

  • Establezca la LogLevel propiedad de 1 para registrar solo eventos graves a través de 6 para registrar toda la actividad del controlador.
  • Establezca la propiedad LogPath en la ruta de acceso completa a la carpeta donde desea guardar los archivos de registro.
  • Establezca la propiedad LogFileCount en el número máximo de archivos de registro que se van a conservar.
  • Establezca la propiedad LogFileSize en el tamaño máximo de cada archivo de registro en bytes.

Para obtener más información, vea las secciones Configuring Logging Options on Windows y Configuring Logging Options on a Non-Windows Machine en la Guía del controlador JDBC de Databricks.