Compartilhar via


Instalar o Databricks Connect para Scala

Observação

Esse artigo aborda o Databricks Connect para Databricks Runtime 13.3 LTS e superior.

Esse artigo descreve como instalar o Databricks Connect para Scala. Confira O que é o Databricks Connect?. Para obter a versão Python deste artigo, consulte Instalar o Databricks Connect para Python.

Requisitos

  • O workspace e o cluster de destino do Azure Databricks devem atender aos requisitos de configuração de computação para o Databricks Connect.
  • O JDK (Java Development Kit) instalado em seu computador de desenvolvimento. O Databricks recomenda que a versão da instalação do JDK que você usa corresponda à versão do JDK em seu cluster do Azure Databricks. Para localizar a versão do JDK em seu cluster, consulte a seção "Ambiente do sistema" das notas sobre a versão do Databricks Runtime para seu cluster. Por exemplo, Zulu 8.70.0.23-CA-linux64 corresponde ao JDK 8. Veja Versões e compatibilidade das notas de versão do Databricks Runtime.
  • Scala instalado no seu computador de desenvolvimento. O Databricks recomenda que a versão da instalação do Scala corresponda à versão do Scala em seu cluster do Azure Databricks. Para localizar a versão Scala do Databricks Runtime do seu cluster, consulte a seção Ambiente do Sistema das notas de versão do Databricks Runtime para essa versão. Veja Versões e compatibilidade das notas de versão do Databricks Runtime.
  • Se você estiver usando UDFs (funções definidas pelo usuário), as versões locais do Scala e java deverão corresponder às versões Scala e Java da versão do Databricks Runtime do cluster. Para localizar as versões Scala e Java da versão do Databricks Runtime do seu cluster, consulte a seção do ambiente de sistema nas notas de versão do Databricks Runtime para essa versão. Veja Versões e compatibilidade das notas de versão do Databricks Runtime.
  • Uma ferramenta de compilação do Scala em seu computador de desenvolvimento, como sbt.

Adicionar uma referência ao cliente do Databricks Connect

Para configurar o cliente do Databricks Connect, primeiro adicione uma referência ao cliente. No arquivo de build do projeto do Scala, como build.sbt para sbt, pom.xml para Maven ou build.gradle para Gradle, adicione a seguinte referência ao cliente do Databricks Connect. Substitua 14.0.0 pela versão da biblioteca do Databricks Connect que corresponde à versão do Databricks Runtime em seu cluster. Você pode encontrar os números de versão da biblioteca do Databricks Connect no repositório central do Maven.

Sbt

libraryDependencies += "com.databricks" % "databricks-connect" % "14.0.0"

Maven

<dependency>
  <groupId>com.databricks</groupId>
  <artifactId>databricks-connect</artifactId>
  <version>14.0.0</version>
</dependency>

Gradle

implementation 'com.databricks.databricks-connect:14.0.0'

Configurar as propriedades da conexão

Em seguida, configure as propriedades para estabelecer uma conexão entre o Databricks Connect e o cluster remoto do Azure Databricks. Essas propriedades incluem configurações para autenticar o Databricks Connect com seu cluster. Consulte Configuração de computação para o Databricks Connect.

Para o Databricks Connect para Databricks Runtime 13.3 LTS e superior, para Scala, o Databricks Connect inclui o SDK do Databricks para Java. Este SDK implementa o padrão de autenticação unificada do cliente do Databricks, uma abordagem arquitetônica e programática consolidada e consistente de autenticação. Essa abordagem ajuda a tornar a configuração e a automação da autenticação com o Azure Databricks mais centralizada e previsível. Ela permite que você configure a autenticação do Azure Databricks uma vez e use essa configuração em várias ferramentas e SDKs do Azure Databricks sem mais alterações posteriores na configuração da autenticação.

Observação