Creación de un servicio vinculado para Azure Databricks
Para ejecutar cuadernos en un área de trabajo de Azure Databricks, la canalización de Azure Data Factory debe poder conectarse al área de trabajo, lo que requiere autenticación. Para habilitar esta conexión autenticada, debe realizar dos tareas de configuración:
- Genere un token de acceso para el área de trabajo de Azure Databricks.
- Cree un servicio vinculado en el recurso de Azure Data Factory que use el token de acceso para conectarse a Azure Databricks.
Generación de un token de acceso
Un token de acceso proporciona un método de autenticación para Azure Databricks como alternativa a las credenciales en forma de nombre de usuario y contraseña. Puede generar tokens de acceso para las aplicaciones, especificando un período de expiración después del cual se debe volver a generar y actualizar el token en las aplicaciones cliente.
Para crear un token de acceso, use la opción Generar nuevo token en la pestaña Desarrollador de la página Configuración de usuario del portal de Azure Databricks.
Creación de un servicio vinculado
Para conectarse a Azure Databricks desde Azure Data Factory, debe crear un servicio vinculado para el proceso de Azure Databricks. Puede crear un servicio vinculado en la página Servicios vinculados de la sección Administrar de Azure Data Factory Studio.
Al crear un servicio vinculado de Azure Databricks, debe especificar las siguientes opciones de configuración:
Parámetro | Descripción |
---|---|
Nombre | Un nombre único para el servicio vinculado |
Descripción | Una descripción significativa |
Tiempo de ejecución de integración | El entorno de ejecución de integración que se usa para ejecutar actividades en este servicio vinculado. Consulte Entorno de ejecución de integración en Azure Data Factory para obtener más información. |
Suscripción de Azure | La suscripción de Azure en la que se aprovisiona Azure Databricks |
Área de trabajo de Databricks | El área de trabajo de Azure Databricks |
Clúster | El clúster de Spark en el que se ejecutará el código de actividad. Puede hacer que Azure Databricks aprovisione dinámicamente un clúster de trabajos a petición o puede especificar un clúster existente en el área de trabajo. |
Tipo de autenticación | Cómo se autenticará la conexión vinculada mediante Azure Databricks. Por ejemplo, mediante un token de acceso (en cuyo caso, debe especificar el token de acceso que generó para el área de trabajo). |
Configuración del clúster | La versión del entorno de ejecución de Databricks, la versión de Python, el tipo de nodo de trabajo y el número de nodos de trabajo del clúster. |