Compartilhar via


Databricks Utilities com o Databricks Connect para Scala

Observação

Esse artigo aborda o Databricks Connect para Databricks Runtime 13.3 LTS e superior.

Este artigo descreve como usar Databricks Utilities com o Databricks Connect para Scala. O Databricks Connect permite que você conecte IDEs populares, servidores de notebook e aplicativos personalizados aos clusters do Azure Databricks. Consulte O que é o Databricks Connect?. Para obter a versão para Python deste artigo, consulte Databricks Utilities com o Databricks Connect para Python.

Observação

Antes de começar a usar o Databricks Connect, você deve configurar o cliente do Databricks Connect.

Use o Databricks Connect para acessar o Databricks Utilities da seguinte maneira:

  • Use DBUtils.getDBUtils para acessar o DBFS (Sistema de Arquivos do Databricks) e os segredos por meio dos Utilitários do Databricks. DBUtils.getDBUtils pertence à biblioteca dos Utilitários do Databricks para Scala.
  • Nenhuma funcionalidade dos Utilitários do Databricks diferente dos utilitários anteriores está disponível para projetos do Scala.
  • O Databricks Connect para Scala já declara uma dependência na biblioteca Databricks Utilities for Scala. Portanto, você não precisa declarar explicitamente essa dependência no arquivo de build do projeto Scala, como build.sbt para sbt, pom.xml para Maven ou build.gradle para Gradle.
  • A autenticação para a biblioteca Databricks Utilities for Scala é determinada ao inicializar a classe DatabricksSession em seu projeto do Databricks Connect para Scala.

Dica

Você também pode usar o SDK do Databricks para Java do Scala para acessar qualquer API REST do Databricks disponível, não apenas as APIs dos Utilitários do Databricks anteriores. Consulte o repositório databricks/databricks-sdk-java no GitHub e também Usar Scala com o SDK do Databricks para Java.

O exemplo a seguir mostra como usar a biblioteca Databricks Utilities for Scala para automatizar um volume do Catálogo do Unity. Este exemplo cria um arquivo nomeado zzz_hello.txt no caminho do volume dentro do workspace, lê os dados do arquivo e o exclui.

import com.databricks.sdk.scala.dbutils.DBUtils

object Main {
  def main(args: Array[String]): Unit = {

    val filePath = "/Volumes/main/default/my-volume/zzz_hello.txt"
    val fileData = "Hello, Databricks!"
    val dbutils = DBUtils.getDBUtils()

    dbutils.fs.put(
      file = filePath,
      contents = fileData,
      overwrite = true
    )

    println(dbutils.fs.head(filePath))

    dbutils.fs.rm(filePath)
  }
}