Compartilhar via


Conectar-se ao Azure Data Explorer usando o Apache Spark para Azure Synapse Analytics

Este artigo descreve como acessar um banco de dados do Azure Data Explorer por meio do Synapse Studio com o Apache Spark para Azure Synapse Analytics.

Pré-requisitos

Acessar o Synapse Studio

Em um workspace do Azure Synapse, selecione Inicializar o Synapse Studio. Na home page do Synapse Studio, selecione Dados para acessar o Pesquisador de Objetos de Dados.

Conectar um banco de dados do Azure Data Explorer a um workspace do Azure Synapse

A conexão de um banco de dados do Azure Data Explorer com um workspace é feita por meio de um serviço vinculado. Com um serviço vinculado do Azure Data Explorer, você pode procurar e explorar dados, além de fazer leituras e gravações do Apache Spark para o Azure Synapse. Você também pode executar trabalhos de integração em um pipeline.

No Pesquisador de Objetos de Dados, siga estas etapas para conectar diretamente um cluster do Azure Data Explorer:

  1. Selecione o ícone + perto de Dados.

  2. Escolha Conectar para se conectar aos dados externos.

  3. Selecione Azure Data Explorer (Kusto) .

  4. Selecione Continuar.

  5. Use um nome amigável para nomear o serviço vinculado. O nome será exibido no Pesquisador de Objetos de Dados e será usado pelos runtimes do Azure Synapse para se conectar ao banco de dados.

  6. Selecione o cluster do Azure Data Explorer na sua assinatura ou insira o URI.

  7. Insira a ID da entidade de serviço e a Chave da entidade de serviço. Verifique se essa entidade de serviço tem acesso de exibição no banco de dados para a operação de leitura e acesso de ingestão para a ingestão de dados.

  8. Insira o nome do banco de dados do Azure Data Explorer.

  9. Selecione Testar conectividade para verificar se você tem as permissões corretas.

  10. Selecione Criar.

    Screenshot that shows a new linked service.

    Observação

    (Opcional) Testar conectividade não valida o acesso de gravação. Verifique se a ID da entidade de serviço tem acesso de gravação ao banco de dados do Azure Data Explorer.

  11. Os clusters e os bancos de dados do Azure Data Explorer são exibidos na guia Vinculados da seção Azure Data Explorer.

    Screenshot that shows browsing for clusters.

  12. Antes de poder interagir com o serviço vinculado de um notebook, ele deve ser publicado no Workspace. Clique em Publicar na barra de ferramentas, revise as alterações pendentes e clique em OK.

    Observação

    Na versão atual, os objetos do banco de dados são preenchidos com base nas permissões da sua conta do Microsoft Entra nos bancos de dados do Azure Data Explorer. Quando você executar notebooks ou trabalhos de integração do Apache Spark, a credencial do serviço de link será usada (por exemplo, entidade de serviço).

Interagir rapidamente com ações geradas por código

Quando você clicar com o botão direito do mouse em um banco de dados ou uma tabela, uma lista de notebooks de exemplo do Spark será exibida. Selecione uma opção para ler, gravar ou transmitir dados para o Azure Data Explorer.

Screenshot that shows new sample notebooks.

Veja um exemplo de leitura de dados. Anexe o notebook ao Pool do Spark e execute a célula.

Screenshot that shows a new read notebook.

Observação

A primeira execução pode levar mais de três minutos para iniciar a sessão do Spark. As execuções subsequentes serão significativamente mais rápidas.

Limitações

Atualmente, o conector do Azure Data Explorer não é compatível com redes virtuais gerenciadas do Azure Synapse.

Próximas etapas