Partilhar via


Conecte-se ao Matillion

O Matillion ETL é uma ferramenta ETL/ELT criada especificamente para plataformas de banco de dados em nuvem, incluindo o Azure Databricks. O Matillion ETL tem uma interface do usuário moderna e baseada em navegador, com uma poderosa funcionalidade de ETL/ELT push-down.

Você pode integrar seus armazéns SQL Databricks (anteriormente pontos de extremidade SQL Databricks) e clusters do Azure Databricks com o Matillion.

Conecte-se ao Matillion usando o Partner Connect

Esta seção descreve como usar o Partner Connect para simplificar o processo de conexão de um SQL warehouse ou cluster existente em seu espaço de trabalho do Azure Databricks ao Matillion.

Requerimentos

Consulte os requisitos para usar o Partner Connect.

Etapas para se conectar

Para se conectar ao Matillion usando o Partner Connect, siga as etapas nesta seção.

Gorjeta

Se você tiver uma conta Matillion existente, o Databricks recomenda que você se conecte ao Matillion manualmente. Isso ocorre porque a experiência de conexão no Partner Connect é otimizada para novas contas de parceiros.

  1. Na barra lateral, clique em Botão Partner Connect Partner Connect.

  2. Clique no bloco Matillion .

    A caixa Email exibe o endereço de email da sua conta do Azure Databricks. Matillion usa este endereço de e-mail para solicitar que você crie uma nova conta Matillion ou entre em sua conta Matillion existente.

  3. Clique em Conectar ao Matillion ETL ou Entrar.

    Uma nova guia é aberta no navegador que exibe o Matillion Hub.

  4. Preencha as instruções no ecrã no Matillion para criar a sua conta Matillion de avaliação de 14 dias ou para iniciar sessão na sua conta Matillion existente.

    Importante

    Se for exibido um erro informando que alguém da sua organização já criou uma conta com o Matillion, entre em contato com um dos administradores da sua organização e peça que eles adicionem você à conta Matillion da sua organização. Depois que eles adicionarem você, entre na sua conta Matillion existente.

  5. Preencha as instruções no ecrã para fornecer os detalhes do seu trabalho e, em seguida, clique em Continuar.

  6. Conclua as instruções na tela para criar uma organização e clique em Continuar.

  7. Clique na organização que você criou e, em seguida, clique em Adicionar instância ETL Matillion.

  8. Clique em Continuar no Azure.

    É apresentado o portal do Azure.

  9. Siga Iniciando o ETL do Matillion a partir de um Modelo ARM do Azure na documentação do ETL do Matillion, começando com a etapa 6.

  10. Siga as instruções na documentação do Matillion ETL.

    O Matillion ETL é aberto no navegador e a caixa de diálogo Criar projeto é exibida.

  11. Siga o projeto Create a Delta Lake on Databricks na documentação do Matillion.

    Para as configurações na seção Delta Lake Connection dentro destas instruções, insira as seguintes informações:

    • Para ID do espaço de trabalho, insira a ID do espaço de trabalho da URL do Azure Databricks por espaço de trabalho. Não inclua nada após o primeiro "ponto" (.). Consulte Nomes de instância, URLs e IDs do espaço de trabalho.
    • Em Nome de utilizador, introduza a palavra token.
    • Para Senha, insira o valor de um token de acesso pessoal do Azure Databricks.

    Para obter a ID do espaço de trabalho e gerar o token de acesso pessoal, faça o seguinte:

    1. Regresse ao separador Partner Connect no seu browser.

    2. Anote o ID do espaço de trabalho.

    3. Clique em Gerar um novo token.

      Uma nova guia é aberta em seu navegador que exibe a página Configurações da interface do usuário do Azure Databricks.

    4. Clique em Gerar novo token.

    5. Opcionalmente, insira uma descrição (comentário) e um período de validade.

    6. Clique em Generate (Gerar).

    7. Copie o token de acesso pessoal gerado e armazene-o em um local seguro.

    8. Regresse ao separador Matillion no seu browser.

    Para as configurações na seção Delta Lake Defaults dentro destas instruções, para Cluster, escolha o nome do SQL warehouse ou cluster.

  12. Continue com as próximas etapas.

Conecte-se ao Matillion manualmente

Esta seção descreve como conectar um cluster ou armazém SQL existente em seu espaço de trabalho do Azure Databricks ao Matillion manualmente.

Nota

Você pode se conectar ao Matillion usando o Partner Connect para simplificar a experiência.

Requerimentos

Antes de integrar com o Matillion manualmente, você deve ter o seguinte:

  • Uma conta Matillion Hub registada.

  • Uma instância de ETL Matillion, que você pode iniciar usando o Azure Marketplace ou o Azure Resource Manager (ARM).

  • Um token de acesso pessoal do Azure Databricks ou um token de ID do Microsoft Entra.

    Nota

    Como prática recomendada de segurança, quando você se autentica com ferramentas, sistemas, scripts e aplicativos automatizados, o Databricks recomenda que você use tokens de acesso pessoal pertencentes a entidades de serviço em vez de usuários do espaço de trabalho. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.

Etapas para se conectar

Para se conectar ao Matillion manualmente, faça o seguinte:

  1. Obtenha o nome do recurso de computação existente que você deseja usar (um SQL warehouse ou cluster) em seu espaço de trabalho. Mais tarde, você escolherá esse nome para concluir a conexão entre seu recurso de computação e sua instância ETL Matillion.

    • Para exibir armazéns SQL em seu espaço de trabalho, clique em Ícone de pontos de extremidade SQL Warehouses na barra lateral. Para criar um novo SQL warehouse, consulte Criar um SQL warehouse.
    • Para exibir os clusters em seu espaço de trabalho, clique em ícone de computação Computar na barra lateral. Para criar um cluster, consulte Referência de configuração de computação.
  2. Siga Conectar à sua instância ETL do Matillion e faça login nela na documentação do Matillion.

  3. Siga o projeto Create a Delta Lake on Databricks na documentação do Matillion.

    Para as configurações na seção Delta Lake Connection dentro destas instruções, insira as seguintes informações:

    • Para ID do espaço de trabalho, insira a ID do espaço de trabalho da URL do Azure Databricks por espaço de trabalho. Não inclua nada após o primeiro "ponto" (.). Consulte Nomes de instância, URLs e IDs do espaço de trabalho.
    • Em Nome de utilizador, introduza a palavra token.
    • Para Senha, insira o token de acesso pessoal do Azure Databricks ou o token de ID do Microsoft Entra.

    Para as configurações na seção Delta Lake Defaults dentro destas instruções, para Cluster, escolha o nome do SQL warehouse ou cluster.

  4. Continue com as próximas etapas.

Próximos passos

Explore um ou mais dos seguintes recursos no site da Matillion: