Compartilhar dados usando o protocolo de compartilhamento aberto Delta Sharing (para provedores)
Este artigo fornece uma visão geral de como os provedores podem usar o protocolo de compartilhamento aberto Delta Sharing para compartilhar dados do seu espaço de trabalho Azure Databricks habilitado para Catálogo Unity com qualquer usuário em qualquer plataforma de computação, em qualquer lugar.
Nota
Se você for um destinatário de dados (um usuário ou grupo de usuários com quem os dados estão sendo compartilhados), consulte em vez disso, Acessar dados compartilhados com você usando o Compartilhamento Delta (para destinatários).
Quem deve usar o protocolo de compartilhamento aberto Delta Sharing?
Há três maneiras de compartilhar dados usando o Delta Sharing:
O protocolo de compartilhamento aberto Databricks, abordado neste artigo, permite compartilhar dados gerenciados em um espaço de trabalho Databricks habilitado para Unity Catalog com usuários em qualquer plataforma de computação.
Essa abordagem usa o servidor de Compartilhamento Delta que é incorporado ao Azure Databricks e é útil quando você gerencia dados usando o Catálogo Unity e deseja compartilhá-los com usuários que não usam Databricks ou não têm acesso a um espaço de trabalho Databricks habilitado para Catálogo Unity. A integração com o Unity Catalog no lado do provedor simplifica a configuração e a governança para provedores.
Uma implementação gerenciada pelo cliente do servidor de código aberto Delta Sharing permite que você compartilhe de qualquer plataforma para qualquer plataforma, seja Databricks ou não.
O protocolo de compartilhamento Databricks-to-Databricks permite que você compartilhe dados de seu espaço de trabalho habilitado para Unity Catalog com usuários que também têm acesso a um espaço de trabalho Databricks habilitado para Unity Catalog.
Consulte Compartilhar dados usando o protocolo Delta Sharing Databricks-to-Databricks (para provedores).
Para obter uma introdução ao Delta Sharing e mais informações sobre essas três abordagens, consulte O que é Delta Sharing?.
Fluxo de trabalho de compartilhamento aberto do Delta Sharing
Esta seção fornece uma visão geral de alto nível do fluxo de trabalho de compartilhamento aberto, com links para documentação detalhada para cada etapa.
No modelo de compartilhamento aberto Delta Sharing:
O provedor de dados cria um destinatário, que é um objeto nomeado que representa um usuário ou grupo de usuários com o qual o provedor de dados deseja compartilhar dados.
Quando o provedor de dados cria o destinatário, o Azure Databricks gera um token, um arquivo de credenciais que inclui o token e um link de ativação que o provedor de dados pode enviar ao destinatário para acessar o arquivo de credenciais.
Para obter detalhes, consulte Etapa 1: criar o destinatário.
O provedor de dados cria um compartilhamento, que é um objeto nomeado que contém uma coleção de tabelas registradas em um metastore do Unity Catalog na conta do provedor.
Para obter detalhes, consulte Criar e gerenciar compartilhamentos para compartilhamento Delta.
O provedor de dados concede ao destinatário acesso ao compartilhamento.
Para obter detalhes, consulte Gerenciar o acesso a compartilhamentos de dados do Delta Sharing (para provedores).
O provedor de dados envia o link de ativação para o destinatário por um canal seguro, juntamente com instruções para usar o link de ativação para baixar o arquivo de credenciais que o destinatário usará para estabelecer uma conexão segura com o provedor de dados para receber os dados compartilhados.
Para obter detalhes, consulte Etapa 2: Obter o link de ativação.
O destinatário dos dados segue o link de ativação para baixar o arquivo de credenciais e, em seguida, usa o arquivo de credenciais para acessar os dados compartilhados.
Os dados partilhados estão disponíveis apenas para leitura. Os utilizadores podem aceder aos dados utilizando a sua plataforma ou ferramentas à escolha.
Para obter detalhes, consulte Ler dados compartilhados usando o compartilhamento aberto do Delta Sharing (para destinatários).
Considerações de configuração e segurança para compartilhamento aberto
Um bom gerenciamento de tokens é fundamental para compartilhar dados com segurança quando você usa o modelo de compartilhamento aberto:
- Os provedores de dados que pretendem usar o compartilhamento aberto devem configurar o tempo de vida do token de destinatário padrão quando habilitam o Compartilhamento Delta para seu metastore do Catálogo Unity. O Databricks recomenda que você configure os tokens para expirar. Veja Ativar o Delta Sharing numa metastore.
- Se você precisar modificar o tempo de vida do token padrão, consulte Modificar o tempo de vida do token do destinatário.
- Incentive os destinatários a gerenciar o arquivo de credenciais baixado com segurança.
- Para obter mais informações sobre gerenciamento de tokens e segurança de compartilhamento aberto, consulte Gerenciar tokens de destinatário (compartilhamento aberto).
Os provedores de dados podem fornecer segurança adicional atribuindo listas de acesso IP para restringir o acesso de destinatários a locais de rede específicos. Consulte Restringir o acesso de destinatários do Compartilhamento Delta usando listas de acesso IP (compartilhamento aberto).