Erstellen eines verknüpften Diensts für Azure Databricks

Abgeschlossen

Um Notebooks in einem Azure Databricks-Arbeitsbereich auszuführen, muss die Azure Data Factory-Pipeline eine Verbindung mit dem Arbeitsbereich herstellen können. Dafür ist Authentifizierung erforderlich. Um diese authentifizierte Verbindung zu aktivieren, müssen Sie zwei Konfigurationsaufgaben ausführen:

  1. Generieren Sie ein Zugriffstoken für Ihren Azure Databricks-Arbeitsbereich.
  2. Erstellen Sie einen verknüpften Dienst in Ihrer Azure Data Factory-Ressource, der das Zugriffstoken verwendet, um eine Verbindung mit Azure Databricks herzustellen.

Generieren eines Zugriffstokens

Ein Zugriffstoken bietet eine Authentifizierungsmethode für Azure Databricks als Alternative zu Anmeldeinformationen in Form eines Benutzernamens und Kennworts. Sie können Zugriffstoken für Anwendungen generieren und einen Ablaufzeitraum angeben, nach dem das Token neu erstellt und in den Clientanwendungen aktualisiert werden muss.

Um ein Zugriffstoken zu erstellen, verwenden Sie die Option Neues Token generieren auf der Registerkarte Entwickler der Seite Benutzereinstellungen im Azure Databricks-Portal.

A screenshot of the Access tokens tab in the User Settings page in the Azure Databricks portal.

Erstellen eines verknüpften Dienstes

Um eine Verbindung mit Azure Databricks aus Azure Data Factory herzustellen, müssen Sie einen verknüpften Dienst für Azure Databricks-Compute erstellen. Sie können einen verknüpften Dienst auf der Seite Verknüpfte Dienste im Abschnitt Verwalten von Azure Data Factory Studio erstellen.

A screenshot of the New linked service wizard in Azure Data Factory Studio.

Wenn Sie einen verknüpften Azure Databricks-Dienst erstellen, müssen Sie die folgenden Konfigurationseinstellungen angeben:

Einstellung BESCHREIBUNG
Name Einen eindeutigen Namen für den verknüpften Dienst
Beschreibung Eine aussagekräftige Beschreibung
Integrationslaufzeit Die Integration Runtime, die zum Ausführen von Aktivitäten in diesem verknüpften Dienst verwendet wird. Weitere Informationen finden Sie unter Integration Runtime in Azure Data Factory.
Azure-Abonnement Das Azure-Abonnement, in dem Azure Databricks bereitgestellt wird
Ein Databricks-Arbeitsbereich Der Azure Databricks-Arbeitsbereich
Cluster Der Spark-Cluster, auf dem der Aktivitätscode ausgeführt wird. Sie können Azure Databricks einen Auftragscluster dynamisch bereitstellen lassen, oder Sie können einen vorhandenen Cluster im Arbeitsbereich angeben.
Authentifizierungsart Wie die verknüpfte Verbindung von Azure Databricks authentifiziert wird. Beispielsweise durch Verwenden eines Zugriffstokens (in diesem Fall müssen Sie das Zugriffstoken angeben, das Sie für Ihren Arbeitsbereich generiert haben).
Clusterkonfiguration Die Databricks-Runtimeversion, die Python-Version, den Workerknotentyp und die Anzahl der Workerknoten für Ihren Cluster.