Creación de un servicio vinculado para Azure Databricks

Completado

Para ejecutar cuadernos en un área de trabajo de Azure Databricks, la canalización de Azure Data Factory debe poder conectarse al área de trabajo, lo que requiere autenticación. Para habilitar esta conexión autenticada, debe realizar dos tareas de configuración:

  1. Genere un token de acceso para el área de trabajo de Azure Databricks.
  2. Cree un servicio vinculado en el recurso de Azure Data Factory que use el token de acceso para conectarse a Azure Databricks.

Generación de un token de acceso

Un token de acceso proporciona un método de autenticación para Azure Databricks como alternativa a las credenciales en forma de nombre de usuario y contraseña. Puede generar tokens de acceso para las aplicaciones, especificando un período de expiración después del cual se debe volver a generar y actualizar el token en las aplicaciones cliente.

Para crear un token de acceso, use la opción Generar nuevo token en la pestaña Desarrollador de la página Configuración de usuario del portal de Azure Databricks.

A screenshot of the Access tokens tab in the User Settings page in the Azure Databricks portal.

Creación de un servicio vinculado

Para conectarse a Azure Databricks desde Azure Data Factory, debe crear un servicio vinculado para el proceso de Azure Databricks. Puede crear un servicio vinculado en la página Servicios vinculados de la sección Administrar de Azure Data Factory Studio.

A screenshot of the New linked service wizard in Azure Data Factory Studio.

Al crear un servicio vinculado de Azure Databricks, debe especificar las siguientes opciones de configuración:

Parámetro Descripción
Nombre Un nombre único para el servicio vinculado
Descripción Una descripción significativa
Tiempo de ejecución de integración El entorno de ejecución de integración que se usa para ejecutar actividades en este servicio vinculado. Consulte Entorno de ejecución de integración en Azure Data Factory para obtener más información.
Suscripción de Azure La suscripción de Azure en la que se aprovisiona Azure Databricks
Área de trabajo de Databricks El área de trabajo de Azure Databricks
Clúster El clúster de Spark en el que se ejecutará el código de actividad. Puede hacer que Azure Databricks aprovisione dinámicamente un clúster de trabajos a petición o puede especificar un clúster existente en el área de trabajo.
Tipo de autenticación Cómo se autenticará la conexión vinculada mediante Azure Databricks. Por ejemplo, mediante un token de acceso (en cuyo caso, debe especificar el token de acceso que generó para el área de trabajo).
Configuración del clúster La versión del entorno de ejecución de Databricks, la versión de Python, el tipo de nodo de trabajo y el número de nodos de trabajo del clúster.