Criar um serviço vinculado para o Azure Databricks

Concluído

Para executar notebooks em um workspace do Azure Databricks, deve ser possível que o pipeline do Azure Data Factory se conecte ao workspace, o que requer autenticação. Para habilitar esta conexão autenticada, realize as duas seguintes tarefas de configuração:

  1. Gere um token de acesso para o workspace do Azure Databricks.
  2. Crie um serviço vinculado no recurso do Azure Data Factory que usa o token de acesso para se conectar ao Azure Databricks.

Gerar um token de acesso

Um token de acesso fornece um método de autenticação para o Azure Databricks como alternativa às credenciais de nome de usuário e senha. É possível gerar tokens de acesso para aplicativos, especificando um período de expiração após o qual o token deve ser regenerado e atualizado nos aplicativos cliente.

Para criar um token de acesso, use a opção Gerar novo token na guia Desenvolvedor da página Configurações do Usuário no portal do Azure Databricks.

A screenshot of the Access tokens tab in the User Settings page in the Azure Databricks portal.

Criar um serviço vinculado

Para se conectar ao Azure Databricks do Azure Data Factory, é necessário criar um serviço vinculado para a computação do Azure Databricks. É possível criar um serviço vinculado na página Serviços vinculados da seção Gerenciar do Azure Data Factory Studio.

A screenshot of the New linked service wizard in Azure Data Factory Studio.

Ao criar um serviço vinculado do Azure Databricks, é necessário especificar as seguintes definições de configuração:

Configuração Descrição
Nome Um nome exclusivo para o serviço vinculado
Descrição Uma descrição significativa
runtime de integração O runtime de integração usado para executar atividades neste serviço vinculado. Confira Runtime de integração no Azure Data Factory para saber mais.
Assinatura do Azure A assinatura do Azure na qual o Azure Databricks é provisionado
Workspace do Databricks O workspace do Azure Databricks
Cluster O cluster do Spark no qual o código de atividade será executado. É possível fazer com que o Azure Databricks provisione dinamicamente um cluster de trabalho sob demanda ou especificar um cluster existente no workspace.
Tipo de autenticação Como a conexão vinculada será autenticada pelo Azure Databricks. Por exemplo, usando um token de acesso (nesse caso, é necessário especificar o token de acesso gerado para o workspace).
Configuração do cluster A versão de runtime do Databricks, a versão do Python, o tipo do nó de trabalho e o número de nós de trabalho para o cluster.