Compartilhar via


Configurar o acesso a dados para ingestão

Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um contêiner no Azure Data Lake Storage Gen2 (ADLS Gen2) para que os usuários do Azure Databricks possam carregar dados do ADLS Gen2 em uma tabela no Azure Databricks.

Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:

  • (Recomendado) Criar um volume do Catálogo do Unity.

  • Crie um local externo do Catálogo do Unity com uma credencial de armazenamento.

  • Inicie um recurso de computação que usa uma entidade de serviço.

  • Gerar credenciais temporárias (um token SAS de Blob).

Antes de começar

Antes de configurar o acesso aos dados no ADLS Gen2, verifique se você tem o seguinte:

  • Dados em um contêiner na sua conta de armazenamento do Azure. Para criar um contêiner, consulte Criar um contêiner na documentação de armazenamento do Azure.

  • Para acessar dados usando um volume do Catálogo do Unity (recomendado), o privilégio READ VOLUME no volume. Para obter mais informações, consulte O que são os volumes do Unity Catalog? e privilégios e objetos protegíveis do Unity Catalog.

  • Para acessar dados usando um local externo do Catálogo do Unity, o privilégio READ FILES no local externo. Para obter mais informações, veja Criar um local externo para conectar o armazenamento em nuvem ao Azure Databricks.

  • Para acessar dados usando um recurso de computação com uma entidade de serviço, permissões de administrador do workspace do Azure Databricks.

  • Para acessar dados usando credenciais temporárias:

    • Permissões de administrador do workspace do Azure Databricks.
    • Permissões em sua conta do Azure para criar tokens SAS de Blob. Isso permite que você gere credenciais temporárias.
  • Um SQL warehouse do Databricks. Para criar um SQL warehouse, confira Criar um SQL warehouse.

  • Familiaridade com a interface do usuário do SQL do Databricks.

Configurar o acesso ao armazenamento em nuvem

Use um dos seguintes métodos para configurar o acesso ao ADLS Gen2:

Limpar

Você pode limpar os recursos associados em sua conta de nuvem e no Azure Databricks se não quiser mais mantê-los.

Excluir a conta de armazenamento do ADLS Gen2

  1. Abra o portal do Azure na sua conta do Azure, normalmente em https://portal.azure.com.
  2. Navegue até sua conta de armazenamento e abra-a.
  3. Clique em Excluir.
  4. Insira o nome da conta de armazenamento e clique em Excluir.

Parar o SQL warehouse

Se você não estiver usando o SQL warehouse para nenhuma outra tarefa, pare-o para evitar custos adicionais.

  1. Na persona do SQL, na barra lateral, clique em SQL Warehouses.
  2. Ao lado do nome do SQL warehouse, clique em Parar.
  3. Quando solicitado, clique novamente em Interromper. novamente.

Próximas etapas

Depois de concluir as etapas neste artigo, os usuários poderão executar o comando COPY INTO para carregar os dados do contêiner do ADLS Gen2 no workspace do Azure Databricks.