Databricks-Hilfsprogramme mit Databricks Connect für Scala
Hinweis
Dieser Artikel behandelt Databricks Connect für Databricks Runtime Version 13.3 LTS und höher.
In diesem Artikel wird beschrieben, wie Databricks-Hilfsprogramme mit Databricks Connect für Scala verwendet werden. Mit Databricks Connect können Sie beliebte IDEs, Notebookserver und benutzerdefinierte Anwendungen mit Azure Databricks-Clustern verbinden. Weitere Informationen finden Sie unter Was ist Databricks Connect?. Die Python-Version dieses Artikels finden Sie unter Databricks-Hilfsprogramme mit Databricks Connect für Python.
Hinweis
Bevor Sie beginnen, Databricks Connect zu verwenden, müssen Sie den Databricks Connect-Client einrichten.
Greifen Sie mit Databricks Connect folgendermaßen auf Databricks-Hilfsprogramme zu:
- Verwenden Sie die
DBUtils.getDBUtils
-Klasse, um über Databricks Utilities auf das Databricks File System (DBFS) und Geheime Schlüssel zuzugreifen.DBUtils.getDBUtils
gehört zur Databricks Hilfsprogramme für Scala-Bibliothek. - Es sind keine anderen Databricks Hilfsprogramm-Funktionalitäten als die vorherigen Hilfsprogramme, die für Scala-Projekte verfügbar sind, vorhanden.
- Databricks Connect für Scala deklariert bereits eine Abhängigkeit von der Bibliothek für Databricks-Hilfsprogramme für Scala, sodass Sie diese Abhängigkeit nicht explizit in der Builddatei Ihres Scala-Projekts deklarieren müssen, wie z. B.
build.sbt
fürsbt
,pom.xml
für Maven oderbuild.gradle
für Gradle. - Die Authentifizierung für die Bibliothek für die Databricks-Hilfsprogramme für Scala wird durch Initiieren der
DatabricksSession
-Klasse in Ihrem Databricks Connect-Projekt für Scala bestimmt.
Tipp
Sie können auch das Databricks SDK für Java von Scala verwenden, um auf alle verfügbaren Databricks-REST-APIs zuzugreifen, nicht nur auf die vorherigen Databricks Hilfsprogramm-APIs. Sehen Sie sich das databricks/databricks-sdk-java-Repository in GitHub an und auch Verwendung von Scala mit dem Databricks SDK für Java.
Das folgende Beispiel zeigt, wie Sie mit der Bibliothek für Databricks-Hilfsprogramme für Scala ein Unity Catalog-Volume automatisieren. In diesem Beispiel wird eine Datei namens zzz_hello.txt
erstellt, die sich im Pfad des Volumes innerhalb des Arbeitsbereichs befindet, die Daten aus der Datei liest und dann die Datei löscht.
import com.databricks.sdk.scala.dbutils.DBUtils
object Main {
def main(args: Array[String]): Unit = {
val filePath = "/Volumes/main/default/my-volume/zzz_hello.txt"
val fileData = "Hello, Databricks!"
val dbutils = DBUtils.getDBUtils()
dbutils.fs.put(
file = filePath,
contents = fileData,
overwrite = true
)
println(dbutils.fs.head(filePath))
dbutils.fs.rm(filePath)
}
}