Installieren von Databricks Connect für Scala
Hinweis
Dieser Artikel behandelt Databricks Connect für Databricks Runtime Version 13.3 LTS und höher.
In diesem Artikel wird beschrieben, wie Sie Databricks Connect für Scala installieren. Weitere Informationen finden Sie unter Was ist Databricks Connect?. Die Python-Version dieses Artikels finden Sie unter Installieren von Databricks Connect für Python.
Anforderungen
Ihr Azure Databricks-Zielarbeitsbereich und -Zielcluster müssen die Anforderungen für die Computekonfiguration für Databricks Connect erfüllen.
Das Java Development Kit (JDK) muss auf Ihrem Entwicklungscomputer installiert sein. Databricks empfiehlt, dass die Version Ihrer JDK-Installation mit der JDK-Version auf Ihrem Azure Databricks-Cluster übereinstimmt. Informationen zur JDK-Version der Databricks-Runtime auf Ihrem Cluster finden Sie im Abschnitt Systemumgebung der Versionshinweise zur Databricks Runtime oder in der Versionskompatibilitätstabelle.
Hinweis
Wenn Sie eine JDK-Installation auswählen, deren Version älter oder neuer als die Version auf Ihrem Cluster ist, kann dies zu unerwarteten Ergebnissen führen. Möglicherweise wird Ihr Code auch überhaupt nicht ausgeführt.
Sie haben Scala auf Ihrem Entwicklungscomputer installiert. Databricks empfiehlt, dass die Version Ihrer Scala-Installation mit der Scala-Version auf Ihrem Azure Databricks-Cluster übereinstimmt. Informationen zur Scala-Version der Databricks-Runtime-Version Ihres Clusters finden Sie im Abschnitt Systemumgebung der Databricks Runtime-Versionshinweise oder in der Versionskompatibilitätstabelle .
Wenn Sie benutzerdefinierte Funktionen (UDFs) verwenden, müssen die lokalen Scala- und Java-Versionen mit den Scala- und Java-Versionen der Databricks-Runtime-Version des Clusters übereinstimmen. Informationen zu den Scala- und Java-Versionen der Databricks-Runtime-Version Ihres Clusters finden Sie im Abschnitt Systemumgebung Abschnitt der Versionshinweise Databricks Runtime oder in der Versionskompatibilitätstabelle.
Es gibt ein Scala-Buildtool auf Ihrem Entwicklungscomputer, z. B.
sbt
.
Versionsunterstützungsmatrix
Die folgende Tabelle zeigt kompatible Databricks Connect-, JDK- und Scala-Versionen. Databricks Connect-Versionsnummern entsprechen Den Versionsnummern der Databricks-Runtime.
Computetyp | Databricks Connect-Version | JDK-Version | Scala-Version |
---|---|---|---|
Cluster | 16.0 und höher 16.0 ML und höher |
JDK 17 | 2.12.18 |
Cluster | 15.4 LTS 15.4 ML LTS |
JDK 8 | 2.12.18 |
Cluster | 13.3 LTS bis 14.3 LTS 13.3 ML LTS bis 14.3 ML LTS |
JDK 8 | 2.12.15 |
Hinzufügen eines Verweises auf den Databricks Connect-Client
Um den Databricks Connect-Client einzurichten, fügen Sie zuerst einen Verweis auf den Client hinzu. Fügen Sie in der Builddatei Ihres Scala-Projekts wie z. B. build.sbt
für sbt
, pom.xml
für Maven oder build.gradle
für Gradle den folgenden Verweis auf den Databricks Connect-Client hinzu: Ersetzen Sie 14.0.0
durch die Version der Databricks Connect-Bibliothek, die der Databricks Runtime-Version auf Ihrem Cluster entspricht. Die Versionsnummern der Databricks Connect-Bibliothek finden Sie im zentralen Maven-Repository.
SBT
libraryDependencies += "com.databricks" % "databricks-connect" % "14.0.0"
Maven
<dependency>
<groupId>com.databricks</groupId>
<artifactId>databricks-connect</artifactId>
<version>14.0.0</version>
</dependency>
Gradle
implementation 'com.databricks.databricks-connect:14.0.0'
Verbindungseigenschaften konfigurieren
Als Nächstes konfigurieren Sie Eigenschaften, um eine Verbindung zwischen Databricks Connect und Ihrem Azure Databricks-Remotecluster herzustellen. Diese Eigenschaften umfassen Einstellungen zum Authentifizieren von Databricks Connect bei Ihrem Cluster. Weitere Informationen finden Sie unter Computekonfiguration für Databricks Connect.
Für Databricks Connect für Databricks Runtime ab Version 13.3 LTS umfasst Databricks Connect das Databricks SDK für Java für Scala. Dieses SDK implementiert den Standard für die einheitliche Databricks-Clientauthentifizierung, einen konsolidierten und konsistenten architektonischen und programmgesteuerten Ansatz für die Authentifizierung. Dieser Ansatz gestaltet die Einrichtung und Automatisierung der Authentifizierung mit Azure Databricks zentralisierter und vorhersagbarer. Er ermöglicht Ihnen, die Azure Databricks-Authentifizierung einmal zu konfigurieren und diese Konfiguration dann für mehrere Azure Databricks-Tools und -SDKs ohne weitere Änderungen an der Authentifizierungskonfiguration zu verwenden.
Hinweis
Die OAuth-User-to-Machine-Authentifizierung (U2M) wird unter Databricks SDK für Java 0.18.0 und höher unterstützt. Möglicherweise müssen Sie die installierte Version ihres Codeprojekts des Databricks SDK für Java auf 0.18.0 oder höher aktualisieren, um die OAuth U2M-Authentifizierung zu verwenden. Weitere Informationen unter Erste Schritte mit dem Databricks SDK für Java.
Für die OAuth U2M-Authentifizierung müssen Sie die Databricks CLI verwenden, um sich zu authentifizieren, bevor Sie Ihren Scala-Code ausführen. Weitere Informationen finden Sie im Tutorial.
OAuth Machine-to-Machine-Authentifizierung (M2M) wird unter Databricks SDK für Java 0.17.0 und höher unterstützt. Möglicherweise müssen Sie die installierte Version des Databricks SDK für Java auf 0.17.0 oder höher aktualisieren, um die OAuth U2M-Authentifizierung zu verwenden. Weitere Informationen unter Erste Schritte mit dem Databricks SDK für Java.
Das Databricks SDK für Java hat noch keine Authentifizierung mit von Azure verwalteten Identitäten implementiert.