Skapa en länkad tjänst för Azure Databricks
Om du vill köra notebook-filer på en Azure Databricks-arbetsyta måste Azure Data Factory-pipelinen kunna ansluta till arbetsytan. som kräver autentisering. Om du vill aktivera den här autentiserade anslutningen måste du utföra två konfigurationsuppgifter:
- Generera en åtkomsttoken för din Azure Databricks-arbetsyta.
- Skapa en länkad tjänst i din Azure Data Factory-resurs som använder åtkomsttoken för att ansluta till Azure Databricks.
Generera en åtkomsttoken
En åtkomsttoken tillhandahåller en autentiseringsmetod för Azure Databricks som ett alternativ till autentiseringsuppgifter i form av ett användarnamn och lösenord. Du kan generera åtkomsttoken för program och ange en förfalloperiod varefter token måste återskapas och uppdateras i klientprogrammen.
Om du vill skapa en åtkomsttoken använder du alternativet Generera ny token på fliken Utvecklare på sidan Användare Inställningar i Azure Databricks-portalen.
Skapa en länkad tjänst
Om du vill ansluta till Azure Databricks från Azure Data Factory måste du skapa en länkad tjänst för Azure Databricks-beräkning . Du kan skapa en länkad tjänst på sidan Länkade tjänster i avsnittet Hantera i Azure Data Factory Studio.
När du skapar en länkad Azure Databricks-tjänst måste du ange följande konfigurationsinställningar:
Inställning | Description |
---|---|
Name | Ett unikt namn för den länkade tjänsten |
beskrivning | En beskrivande beskrivning |
Integration runtime | Den integrationskörning som används för att köra aktiviteter i den här länkade tjänsten. Mer information finns i Integration Runtime i Azure Data Factory . |
Azure-prenumeration | Azure-prenumerationen där Azure Databricks etableras |
Databricks-arbetsyta | Azure Databricks-arbetsytan |
Kluster | Spark-klustret där aktivitetskoden ska köras. Du kan låta Azure Databricks dynamiskt etablera ett jobbkluster på begäran eller ange ett befintligt kluster på arbetsytan. |
Authentication type | Hur den länkade anslutningen autentiseras av Azure Databricks. Du kan till exempel använda en åtkomsttoken (i så fall måste du ange den åtkomsttoken som du genererade för din arbetsyta). |
Klusterkonfiguration | Databricks-körningsversionen, Python-versionen, arbetsnodtypen och antalet arbetsnoder för klustret. |