Configurações de funcionalidade para o Driver ODBC do Databricks
Este artigo descreve como definir configurações especiais e avançadas de funcionalidade para o Driver ODBC do Databricks.
O driver ODBC do Databricks oferece as seguintes configurações de capacidade de drivers especiais e avançadas.
- Definir o esquema inicial no ODBC
- Suporte a consultas ANSI SQL-92 no ODBC
- Extrair resultados de consultas grandes no ODBC
- Serialização de seta no ODBC
- Busca na nuvem no ODBC
- Habilitar o registro em log
Definir o esquema inicial no ODBC
O driver ODBC permite que você especifique o esquema definindo Schema=<schema-name>
como uma configuração de conexão. Isso é equivalente à execução de USE <schema-name>
.
Suporte à consulta ANSI SQL-92 no ODBC
O driver ODBC aceita consultas SQL no dialeto ANSI SQL-92 e converte as consultas para o dialeto Databricks SQL. No entanto, se o seu aplicativo gerar o Databricks SQL diretamente ou se ele usar qualquer sintaxe de SQL padrão não ANSI SQL-92 específica do Azure Databricks, o Databricks recomendará que você defina UseNativeQuery=1
como uma configuração de conexão. Com essa configuração, o driver transmite as consultas SQL textualmente para o Azure Databricks.
Extrair resultados de consultas grandes no ODBC
Para obter o melhor desempenho ao extrair resultados de consultas grandes, use a última versão do driver ODBC que inclui as otimizações a seguir.
Serialização de seta no ODBC
A versão 2.6.15 e superior do driver ODBC dá suporte a um formato de serialização otimizada dos resultados de consultas que usa o Apache Arrow.
Busca na nuvem no ODBC
A versão 2.6.17 e superior do driver ODBC dá suporte à Busca na Nuvem, uma funcionalidade que busca resultados da consulta por meio do armazenamento em nuvem configurado na sua implantação do Azure Databricks.
Os resultados da consulta são carregados em uma localização de armazenamento interno do DBFS como arquivos serializados com o Arrow de até 20 MB. Quando o driver envia solicitações de busca após a conclusão da consulta, o Azure Databricks gera e retorna assinaturas de acesso compartilhado para os arquivos carregados. Em seguida, o driver ODBC usa as URLs para baixar os resultados diretamente do DBFS.
A Busca na Nuvem é usada somente para resultados de consultas maiores que 1 MB. Os resultados menores são recuperados diretamente do Azure Databricks.
O Azure Databricks coleta automaticamente como lixo os arquivos acumulados que são marcados para exclusão após 24 horas. Esses arquivos marcados são completamente excluídos após um período superior a 24 horas.
Para saber mais sobre a arquitetura da Busca na Nuvem, confira Como atingimos a conectividade de alta largura de banda com as ferramentas de BI.
Habilitar o registro em log
Para habilitar o log no driver ODBC para Windows, defina os seguintes campos no Administrador de fonte de dados ODBC para o DSN relacionado:
- Defina o campo Log Level de FATAL para registrar apenas eventos graves através de TRACE para registrar todas as atividades do driver.
- Defina o campo Log Path como o caminho completo para a pasta onde deseja salvar os arquivos de log.
- Defina o campo Número máximo de arquivos para o número máximo de arquivos de log a serem mantidos.
- Defina o campo Tamanho máximo do arquivo para o tamanho máximo de cada arquivo de log em megabytes.
Para habilitar o registro no driver ODBC para uma máquina não Windows, defina as seguintes propriedades no DSN relacionado ou na cadeia de conexão sem DSN:
- Configure a propriedade
LogLevel
de1
para registrar apenas eventos graves até6
para registrar todas as atividades do driver. - Defina a propriedade
LogPath
como o caminho completo para a pasta onde deseja salvar os arquivos de log. - Configure a propriedade
LogFileCount
com o número máximo de arquivos de log a serem mantidos. - Configure a propriedade
LogFileSize
para o tamanho máximo de cada arquivo de log em bytes.
Para obter mais informações, veja as seções Configuring Logging Options on Windows
e Configuring Logging Options on a Non-Windows Machine
no Databricks JDBC Driver Guide.