Udostępnij za pośrednictwem


Instalowanie programu Databricks Connect dla języka Scala

Uwaga

W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.

W tym artykule opisano sposób instalowania programu Databricks Connect dla języka Scala. Zobacz Co to jest usługa Databricks Connect?. Aby zapoznać się z wersją języka Python tego artykułu, zobacz Instalowanie programu Databricks Connect dla języka Python.

Wymagania

  • Docelowy obszar roboczy i klaster usługi Azure Databricks muszą spełniać wymagania konfiguracji obliczeniowej dla usługi Databricks Connect.
  • Zestaw Java Development Kit (JDK) zainstalowany na komputerze deweloperskim. Usługa Databricks zaleca, aby wersja używanej instalacji zestawu JDK odpowiadała wersji zestawu JDK w klastrze usługi Azure Databricks. Aby znaleźć wersję zestawu JDK w klastrze, zapoznaj się z sekcją "Środowisko systemowe" informacji o wersji środowiska Databricks Runtime dla klastra. Na przykład Zulu 8.70.0.23-CA-linux64 odpowiada zestawowi JDK 8. Zobacz Databricks Runtime release notes versions and compatibility (Wersje i zgodność środowiska Databricks Runtime).
  • Język Scala zainstalowany na komputerze deweloperskim. Usługa Databricks zaleca, aby wersja instalacji języka Scala odpowiadała wersji języka Scala w klastrze usługi Azure Databricks. Aby znaleźć wersję Scala dla wersji środowiska Databricks Runtime używanego przez klaster, zapoznaj się z sekcją Środowisko systemowe w informacjach o tej wersji środowiska Databricks Runtime. Zobacz Databricks Runtime release notes versions and compatibility (Wersje i zgodność środowiska Databricks Runtime).
  • Jeśli używasz funkcji zdefiniowanych przez użytkownika (UDF), lokalne wersje języka Scala i Java muszą być zgodne z wersjami języka Scala i Java wersji środowiska Databricks Runtime klastra. Aby znaleźć wersje Scala i Java wersji Databricks Runtime używaną przez twój klaster, zapoznaj się z sekcją środowiska systemowego w informacjach o wersji Databricks Runtime. Zobacz Databricks Runtime release notes versions and compatibility (Wersje i zgodność środowiska Databricks Runtime).
  • Narzędzie kompilacji Scala na maszynie deweloperów, takie jak sbt.

Dodawanie odwołania do klienta usługi Databricks Connect

Aby skonfigurować klienta usługi Databricks Connect, najpierw dodaj odwołanie do klienta. W pliku kompilacji projektu Scala, takim jak build.sbtsbtdla programu , pom.xml dla programu Maven lub build.gradle narzędzia Gradle dodaj następujące odwołanie do klienta Databricks Connect. Zastąp 14.0.0 element wersją biblioteki Databricks Connect zgodną z wersją środowiska Databricks Runtime w klastrze. Numery wersji biblioteki usługi Databricks Connect można znaleźć w centralnym repozytorium Maven.

Sbt

libraryDependencies += "com.databricks" % "databricks-connect" % "14.0.0"

Maven

<dependency>
  <groupId>com.databricks</groupId>
  <artifactId>databricks-connect</artifactId>
  <version>14.0.0</version>
</dependency>

Gradle

implementation 'com.databricks.databricks-connect:14.0.0'

Konfigurowanie właściwości połączenia

Następnie skonfiguruj właściwości w celu nawiązania połączenia między usługą Databricks Connect i zdalnym klastrem usługi Azure Databricks. Te właściwości obejmują ustawienia służące do uwierzytelniania usługi Databricks Connect z klastrem. Zobacz Konfiguracja obliczeń dla usługi Databricks Connect.

W przypadku usługi Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego w przypadku języka Scala usługa Databricks Connect zawiera zestaw SDK usługi Databricks dla języka Java. Ten zestaw SDK implementuje ujednolicony standard uwierzytelniania klienta usługi Databricks, skonsolidowane i spójne podejście architektoniczne i programowe do uwierzytelniania. Takie podejście sprawia, że konfigurowanie i automatyzowanie uwierzytelniania za pomocą usługi Azure Databricks jest bardziej scentralizowane i przewidywalne. Umożliwia ona skonfigurowanie uwierzytelniania usługi Azure Databricks raz, a następnie użycie tej konfiguracji w wielu narzędziach i zestawach SDK usługi Azure Databricks bez dalszych zmian konfiguracji uwierzytelniania.

Uwaga

  • Uwierzytelnianie typu użytkownik-komputer (U2M) protokołu OAuth jest obsługiwane w zestawie SDK usługi Databricks dla języka Java 0.18.0 i nowszych. Może być konieczne zaktualizowanie zainstalowanej wersji zestawu SDK usługi Databricks dla języka Java do wersji 0.18.0 lub nowszej w celu użycia uwierzytelniania OAuth U2M. Zobacz Wprowadzenie do zestawu SDK usługi Databricks dla języka Java.

    W przypadku uwierzytelniania OAuth U2M należy użyć interfejsu wiersza polecenia usługi Databricks do uwierzytelnienia przed uruchomieniem kodu Języka Scala. Zobacz Samouczek.

  • Uwierzytelnianie maszyny do maszyny (M2M) protokołu OAuth jest obsługiwane w zestawie SDK usługi Databricks dla języka Java 0.17.0 i nowszych. Może być konieczne zaktualizowanie zainstalowanej wersji zestawu SDK usługi Databricks dla języka Java do wersji 0.17.0 lub nowszej w celu użycia uwierzytelniania OAuth U2M. Zobacz Wprowadzenie do zestawu SDK usługi Databricks dla języka Java.

  • Zestaw SDK usługi Databricks dla języka Java nie zaimplementował jeszcze uwierzytelniania tożsamości zarządzanych platformy Azure.