Utilidades de Databricks con Databricks Connect para Scala
Nota
En este artículo se describe Databricks Connect para Databricks Runtime 13.3 LTS y versiones posteriores.
En este artículo se describe cómo usar Utilidades de Databricks con Databricks Connect para Scala. Databricks Connect permite conectar IDEs populares, servidores de notebooks y aplicaciones personalizadas a clústeres de Azure Databricks. Consulte ¿Qué es Databricks Connect?. Para obtener la versión en Python de este artículo, consulte utilidades de Databricks con Databricks Connect para Python.
Nota
Antes de empezar a usar Databricks Connect, es necesario configurar el cliente de Databricks Connect.
Use Databricks Connect para acceder a las utilidades de Databricks de la siguiente manera:
- Use
DBUtils.getDBUtils
para acceder Databricks File System (DBFS) y a los secretos a través de Databricks Utilities.DBUtils.getDBUtils
pertenece a la biblioteca de utilidades de Databricks para Scala. - No hay ninguna funcionalidad de utilidades de Databricks distinta de las utilidades anteriores disponibles para proyectos de Scala.
- Databricks Connect para Scala ya declara una dependencia de las utilidades de Databricks para la biblioteca de Scala, por lo que no es necesario declarar explícitamente esta dependencia en el archivo de compilación del proyecto de Scala, como
build.sbt
parasbt
,pom.xml
para Maven obuild.gradle
para Gradle. - La autenticación de las utilidades de Databricks para la biblioteca de Scala se determina mediante la inicialización de la clase
DatabricksSession
en el proyecto de Databricks Connect para Scala.
Sugerencia
También puede usar el SDK de Databricks para Java desde Scala para acceder a cualquier API REST de Databricks disponible, no solo a las API de utilidades de Databricks anteriores. Consulte el repositorio databricks/databricks-sdk-java en GitHub y use Scala con el SDK de Databricks para Java.
En el ejemplo siguiente se muestra cómo usar las utilidades de Databricks para la biblioteca de Scala para automatizar un volumen de Catálogo de Unity. En este ejemplo se crea un archivo denominado zzz_hello.txt
en la ruta de acceso del volumen dentro del área de trabajo, se leen los datos del archivo y, a continuación, se elimina el archivo.
import com.databricks.sdk.scala.dbutils.DBUtils
object Main {
def main(args: Array[String]): Unit = {
val filePath = "/Volumes/main/default/my-volume/zzz_hello.txt"
val fileData = "Hello, Databricks!"
val dbutils = DBUtils.getDBUtils()
dbutils.fs.put(
file = filePath,
contents = fileData,
overwrite = true
)
println(dbutils.fs.head(filePath))
dbutils.fs.rm(filePath)
}
}