Instalowanie programu Databricks Connect dla języka Scala
Uwaga
W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.
W tym artykule opisano sposób instalowania programu Databricks Connect dla języka Scala. Zobacz Co to jest usługa Databricks Connect?. Aby zapoznać się z wersją języka Python tego artykułu, zobacz Instalowanie programu Databricks Connect dla języka Python.
Wymagania
- Docelowy obszar roboczy i klaster usługi Azure Databricks muszą spełniać wymagania konfiguracji obliczeniowej dla usługi Databricks Connect.
- Zestaw Java Development Kit (JDK) zainstalowany na komputerze deweloperskim. Usługa Databricks zaleca, aby wersja używanej instalacji zestawu JDK odpowiadała wersji zestawu JDK w klastrze usługi Azure Databricks. Aby znaleźć wersję zestawu JDK w klastrze, zapoznaj się z sekcją "Środowisko systemowe" informacji o wersji środowiska Databricks Runtime dla klastra. Na przykład
Zulu 8.70.0.23-CA-linux64
odpowiada zestawowi JDK 8. Zobacz Databricks Runtime release notes versions and compatibility (Wersje i zgodność środowiska Databricks Runtime). - Język Scala zainstalowany na komputerze deweloperskim. Usługa Databricks zaleca, aby wersja instalacji języka Scala odpowiadała wersji języka Scala w klastrze usługi Azure Databricks. Aby znaleźć wersję Scala dla wersji środowiska Databricks Runtime używanego przez klaster, zapoznaj się z sekcją Środowisko systemowe w informacjach o tej wersji środowiska Databricks Runtime. Zobacz Databricks Runtime release notes versions and compatibility (Wersje i zgodność środowiska Databricks Runtime).
- Jeśli używasz funkcji zdefiniowanych przez użytkownika (UDF), lokalne wersje języka Scala i Java muszą być zgodne z wersjami języka Scala i Java wersji środowiska Databricks Runtime klastra. Aby znaleźć wersje Scala i Java wersji Databricks Runtime używaną przez twój klaster, zapoznaj się z sekcją środowiska systemowego
w informacjach o wersji Databricks Runtime. Zobacz Databricks Runtime release notes versions and compatibility (Wersje i zgodność środowiska Databricks Runtime). - Narzędzie kompilacji Scala na maszynie deweloperów, takie jak
sbt
.
Dodawanie odwołania do klienta usługi Databricks Connect
Aby skonfigurować klienta usługi Databricks Connect, najpierw dodaj odwołanie do klienta. W pliku kompilacji projektu Scala, takim jak build.sbt
sbt
dla programu , pom.xml
dla programu Maven lub build.gradle
narzędzia Gradle dodaj następujące odwołanie do klienta Databricks Connect. Zastąp 14.0.0
element wersją biblioteki Databricks Connect zgodną z wersją środowiska Databricks Runtime w klastrze. Numery wersji biblioteki usługi Databricks Connect można znaleźć w centralnym repozytorium Maven.
Sbt
libraryDependencies += "com.databricks" % "databricks-connect" % "14.0.0"
Maven
<dependency>
<groupId>com.databricks</groupId>
<artifactId>databricks-connect</artifactId>
<version>14.0.0</version>
</dependency>
Gradle
implementation 'com.databricks.databricks-connect:14.0.0'
Konfigurowanie właściwości połączenia
Następnie skonfiguruj właściwości w celu nawiązania połączenia między usługą Databricks Connect i zdalnym klastrem usługi Azure Databricks. Te właściwości obejmują ustawienia służące do uwierzytelniania usługi Databricks Connect z klastrem. Zobacz Konfiguracja obliczeń dla usługi Databricks Connect.
W przypadku usługi Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego w przypadku języka Scala usługa Databricks Connect zawiera zestaw SDK usługi Databricks dla języka Java. Ten zestaw SDK implementuje ujednolicony standard uwierzytelniania klienta usługi Databricks, skonsolidowane i spójne podejście architektoniczne i programowe do uwierzytelniania. Takie podejście sprawia, że konfigurowanie i automatyzowanie uwierzytelniania za pomocą usługi Azure Databricks jest bardziej scentralizowane i przewidywalne. Umożliwia ona skonfigurowanie uwierzytelniania usługi Azure Databricks raz, a następnie użycie tej konfiguracji w wielu narzędziach i zestawach SDK usługi Azure Databricks bez dalszych zmian konfiguracji uwierzytelniania.
Uwaga
Uwierzytelnianie typu użytkownik-komputer (U2M) protokołu OAuth jest obsługiwane w zestawie SDK usługi Databricks dla języka Java 0.18.0 i nowszych. Może być konieczne zaktualizowanie zainstalowanej wersji zestawu SDK usługi Databricks dla języka Java do wersji 0.18.0 lub nowszej w celu użycia uwierzytelniania OAuth U2M. Zobacz Wprowadzenie do zestawu SDK usługi Databricks dla języka Java.
W przypadku uwierzytelniania OAuth U2M należy użyć interfejsu wiersza polecenia usługi Databricks do uwierzytelnienia przed uruchomieniem kodu Języka Scala. Zobacz Samouczek.
Uwierzytelnianie maszyny do maszyny (M2M) protokołu OAuth jest obsługiwane w zestawie SDK usługi Databricks dla języka Java 0.17.0 i nowszych. Może być konieczne zaktualizowanie zainstalowanej wersji zestawu SDK usługi Databricks dla języka Java do wersji 0.17.0 lub nowszej w celu użycia uwierzytelniania OAuth U2M. Zobacz Wprowadzenie do zestawu SDK usługi Databricks dla języka Java.
Zestaw SDK usługi Databricks dla języka Java nie zaimplementował jeszcze uwierzytelniania tożsamości zarządzanych platformy Azure.