Utilidades Databricks con Databricks Connect para Scala
Nota:
Este artículo describe Databricks Connect para Databricks Runtime 13.3 LTS y versiones posteriores.
En este artículo se describe cómo usar Utilidades de Databricks con Databricks Connect para Scala. Databricks Connect le habilita para conectar los IDE populares, servidores de cuadernos y aplicaciones personalizadas a los clústeres de Azure Databricks. Consulte ¿Qué es Databricks Connect?. Para obtener la versión en Python de este artículo, consulte utilidades de Databricks con Databricks Connect para Python.
Nota:
Antes de empezar a usar Databricks Connect, debeconfigurar el cliente de Databricks Connect.
Use Databricks Connect para acceder a utilidades de Databricks de la siguiente manera:
- Use
DBUtils.getDBUtils
para acceder Databricks File System (DBFS) y a los secretos a través de Databricks Utilities.DBUtils.getDBUtils
pertenece a la biblioteca Databricks Utilities para Scala. - No hay ninguna funcionalidad de Databricks Utilities distinta de las utilidades anteriores disponibles para proyectos de Scala.
- Databricks Connect para Scala ya declara una dependencia de las utilidades de Databricks para la biblioteca de Scala, por lo que no es necesario declarar explícitamente esta dependencia en el archivo de compilación del proyecto de Scala, como
build.sbt
parasbt
,pom.xml
para Maven obuild.gradle
para Gradle. - La autenticación de las utilidades de Databricks para la biblioteca de Scala se determina mediante la inicialización de la clase
DatabricksSession
en el proyecto de Databricks Connect para Scala.
Sugerencia
También puede usar el SDK de Databricks para Java desde Scala para acceder a cualquier API REST de Databricks disponible, no solo a las API de Databricks Utilities anteriores. Consulte el repositorio databricks/databricks-sdk-java en GitHub y use Scala con el SDK de Databricks para Java.
En el ejemplo siguiente se muestra cómo usar las utilidades de Databricks para la biblioteca de Scala para automatizar un volumen de catálogo de unidad. En este ejemplo se crea un nombre de archivo zzz_hello.txt
en la ruta de acceso del volumen dentro del área de trabajo, se leen los datos del archivo y, a continuación, se elimina el archivo.
import com.databricks.sdk.scala.dbutils.DBUtils
object Main {
def main(args: Array[String]): Unit = {
val filePath = "/Volumes/main/default/my-volume/zzz_hello.txt"
val fileData = "Hello, Databricks!"
val dbutils = DBUtils.getDBUtils()
dbutils.fs.put(
file = filePath,
contents = fileData,
overwrite = true
)
println(dbutils.fs.head(filePath))
dbutils.fs.rm(filePath)
}
}