Een gekoppelde service maken voor Azure Databricks

Voltooid

Als u notebooks wilt uitvoeren in een Azure Databricks-werkruimte, moet de Azure Data Factory-pijplijn verbinding kunnen maken met de werkruimte; waarvoor verificatie is vereist. Als u deze geverifieerde verbinding wilt inschakelen, moet u twee configuratietaken uitvoeren:

  1. Genereer een toegangstoken voor uw Azure Databricks-werkruimte.
  2. Maak een gekoppelde service in uw Azure Data Factory-resource die gebruikmaakt van het toegangstoken om verbinding te maken met Azure Databricks.

Een toegangstoken genereren

Een toegangstoken biedt een verificatiemethode voor Azure Databricks als alternatief voor referenties in de vorm van een gebruikersnaam en wachtwoord. U kunt toegangstokens genereren voor toepassingen, waarbij een verloopperiode wordt opgegeven waarna het token opnieuw moet worden gegenereerd en bijgewerkt in de clienttoepassingen.

Als u een Access-token wilt maken, gebruikt u de optie Nieuw token genereren op het tabblad Ontwikkelaars van de pagina Gebruikers Instellingen in de Azure Databricks-portal.

A screenshot of the Access tokens tab in the User Settings page in the Azure Databricks portal.

Een gekoppelde service maken

Als u vanuit Azure Data Factory verbinding wilt maken met Azure Databricks, moet u een gekoppelde service maken voor Azure Databricks Compute. U kunt een gekoppelde service maken op de pagina Gekoppelde services in de sectie Beheren van Azure Data Factory Studio.

A screenshot of the New linked service wizard in Azure Data Factory Studio.

Wanneer u een gekoppelde Azure Databricks-service maakt, moet u de volgende configuratie-instellingen opgeven:

Instelling Omschrijving
Naam Een unieke naam voor de gekoppelde service
Beschrijving Een zinvolle beschrijving
Integration Runtime De integratieruntime die wordt gebruikt voor het uitvoeren van activiteiten in deze gekoppelde service. Zie Integration Runtime in Azure Data Factory voor meer informatie.
Azure-abonnement Het Azure-abonnement waarin Azure Databricks is ingericht
Databricks-werkruimte De Azure Databricks-werkruimte
Cluster Het Spark-cluster waarop de activiteitscode wordt uitgevoerd. U kunt Azure Databricks dynamisch een taakcluster op aanvraag inrichten of u kunt een bestaand cluster in de werkruimte opgeven.
Authentication type Hoe de gekoppelde verbinding wordt geverifieerd door Azure Databricks. Als u bijvoorbeeld een toegangstoken gebruikt (in dat geval moet u het toegangstoken opgeven dat u hebt gegenereerd voor uw werkruimte).
Clusterconfiguratie De Runtime-versie van Databricks, python-versie, het type werkknooppunt en het aantal werkknooppunten voor uw cluster.