Configurar o acesso a dados para ingestão
Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um contêiner no Azure Data Lake Storage Gen2 (ADLS Gen2) para que os usuários do Azure Databricks possam carregar dados do ADLS Gen2 em uma tabela no Azure Databricks.
Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:
(Recomendado) Criar um volume do Catálogo do Unity.
Crie um local externo do Catálogo do Unity com uma credencial de armazenamento.
Inicie um recurso de computação que usa uma entidade de serviço.
Gerar credenciais temporárias (um token SAS de Blob).
Antes de começar
Antes de configurar o acesso aos dados no ADLS Gen2, verifique se você tem o seguinte:
Dados em um contêiner na sua conta de armazenamento do Azure. Para criar um contêiner, consulte Criar um contêiner na documentação de armazenamento do Azure.
Para acessar dados usando um volume do Catálogo do Unity (recomendado), o privilégio
READ VOLUME
no volume. Para obter mais informações, consulte O que são os volumes do Unity Catalog? e privilégios e objetos protegíveis do Unity Catalog.Para acessar dados usando um local externo do Catálogo do Unity, o privilégio
READ FILES
no local externo. Para obter mais informações, veja Criar um local externo para conectar o armazenamento em nuvem ao Azure Databricks.Para acessar dados usando um recurso de computação com uma entidade de serviço, permissões de administrador do workspace do Azure Databricks.
Para acessar dados usando credenciais temporárias:
- Permissões de administrador do workspace do Azure Databricks.
- Permissões em sua conta do Azure para criar tokens SAS de Blob. Isso permite que você gere credenciais temporárias.
Um SQL warehouse do Databricks. Para criar um SQL warehouse, confira Criar um SQL warehouse.
Familiaridade com a interface do usuário do SQL do Databricks.
Configurar o acesso ao armazenamento em nuvem
Use um dos seguintes métodos para configurar o acesso ao ADLS Gen2:
(Recomendado) Criar um volume do Catálogo do Unity. Para obter mais informações, consulte O que são os volumes do Unity Catalog?.
Configure um local externo do Catálogo do Unity com uma credencial de armazenamento. Para obter mais informações sobre locais externos, veja Criar um local externo para conectar o armazenamento em nuvem ao Azure Databricks.
Configure um recurso de computação para usar uma entidade de serviço. Para obter mais informações, consulte Configurar uma entidade de serviço.
Gere credenciais temporárias (um token SAS de Blob) para compartilhar com outros usuários do Azure Databricks. Para obter mais informações, consulte Gerar credenciais temporárias para ingestão.
Limpar
Você pode limpar os recursos associados em sua conta de nuvem e no Azure Databricks se não quiser mais mantê-los.
Excluir a conta de armazenamento do ADLS Gen2
- Abra o portal do Azure na sua conta do Azure, normalmente em https://portal.azure.com.
- Navegue até sua conta de armazenamento e abra-a.
- Clique em Excluir.
- Insira o nome da conta de armazenamento e clique em Excluir.
Parar o SQL warehouse
Se você não estiver usando o SQL warehouse para nenhuma outra tarefa, pare-o para evitar custos adicionais.
- Na persona do SQL, na barra lateral, clique em SQL Warehouses.
- Ao lado do nome do SQL warehouse, clique em Parar.
- Quando solicitado, clique novamente em Interromper. novamente.
Próximas etapas
Depois de concluir as etapas neste artigo, os usuários poderão executar o comando COPY INTO
para carregar os dados do contêiner do ADLS Gen2 no workspace do Azure Databricks.
Para carregar dados usando um volume do Catálogo do Unity ou um local externo, confira Carregar dados usando COPY INTO com volumes do Catálogo do Unity ou locais externos.
Para carregar dados usando um SQL warehouse com uma entidade de serviço, confira Carregar dados usando COPY INTO com uma entidade de serviço.
Para carregar dados usando credenciais temporárias (um token SAS de Blob), consulte Carregar dados usando COPY INTO com credenciais temporárias.