Executar notebooks em clean rooms
Importante
Esse recurso está em uma versão prévia.
Este artigo descreve como executar notebooks em clean rooms. Notebooks são a interface que os colaboradores usam para executar a análise de dados em colaboração.
Para saber como adicionar um notebook a um clean room, consulte Como criar clean rooms.
Antes de começar
Para executar um notebook em um clean room, você deve ser:
- O proprietário do clean room ou ter o privilégio
EXECUTE CLEAN ROOM TASK
no clean room. - Um colaborador que não criou o notebook. O criador do notebook não pode executá-lo. Isso impõe a aprovação implícita do notebook por ambas as partes.
Observação
O criador é designado automaticamente como proprietário da Clean Room em sua conta do Databricks. O administrador do metastore da organização colaboradora é automaticamente designado como proprietário da Clean Room em sua conta do Databricks. Você pode transferir a propriedade. Consulta Gerenciar a propriedade do objeto do Catálogo do Unity.
Executar um notebook em um clean room
Para executar um notebook em um clean room, você deve usar o Explorador de Catálogos.
No workspace do Azure Databricks, clique em Catálogo.
Na parte superior do painel Catálogo, clique no ícone de engrenagem e selecione Clean Rooms.
Como alternativa, na página Acesso rápido, clique no botão Clean Rooms >.
Selecione o clean room na lista.
Em Notebooks, clique no notebook para abri-lo no modo de visualização.
Clique no botão Executar.
Você só pode executar notebooks compartilhados por outro colaborador.
(Opcional) Na caixa de diálogo Executar notebook com parâmetros , clique em + Adicionar para passar valores de parâmetro para a tarefa de trabalho do notebook.
Para obter mais informações sobre parâmetros para tarefas de trabalho, confira Parametrizar trabalhos.
Clique na caixa de seleção de confirmação.
Clique em Executar.
Clique em Ver detalhes para exibir o progresso da execução.
Como alternativa, você pode exibir o progresso da execução indo até Execuções nesta página ou clicando em Fluxos de Trabalho na barra lateral do workspace e indo até a guia Execuções do trabalho.
Exiba os resultados da execução do notebook.
Os resultados do notebook são exibidos após a conclusão da execução. Para exibir as execuções anteriores, vá para Execuções e clique no link na coluna Hora de início.
Compartilhar a saída do notebook usando tabelas de saída
As tabelas de saída são tabelas temporárias somente leitura geradas por uma execução de notebook e compartilhadas com o metastore do executor de notebook. Se o notebook criar uma tabela de saída, o executor do notebook poderá acessá-la em um catálogo de saída e compartilhá-la com outros usuários em seu workspace. Consulte Criar e trabalhar com tabelas de saída em Clean Rooms do Databricks.
Usar fluxos de trabalho do Azure Databricks para executar notebooks de sala limpa
Você pode usar trabalhos do Azure Databricks para executar notebooks e executar tarefas em tabelas de saída, permitindo que você crie fluxos de trabalho complexos que envolvem seus ativos de sala limpa. Esses recursos, em particular, tornam esses fluxos de trabalho possíveis:
- O tipo de tarefa Bloco de anotações Sala Limpa permite selecionar e executar um bloco de anotações Sala Limpa como uma tarefa Fluxos de trabalho. Consulte Tarefa de bloco de anotações de Sala Limpa para trabalhos.
- As execuções de notebook iniciadas pelo fluxo de trabalho podem gerar tabelas de saída que podem ser referenciadas por outras tarefas de fluxo de trabalho. Consulte Criar e trabalhar com tabelas de saída em Clean Rooms do Databricks.
- Os fluxos de trabalho podem usar valores de Tarefa que passam valores de parâmetro de trabalho para blocos de anotações de sala limpa ou capturar a saída do bloco de anotações de sala limpa e passar essa saída para outras tarefas de fluxo de trabalho. Confira Usar valores de tarefa para passar informações entre tarefas.
Por exemplo, você pode criar um fluxo de trabalho que propaga o nome do esquema de saída gerado dinamicamente entre tarefas, fazendo o seguinte:
Crie uma tarefa do tipo de tarefa Bloco de anotações Salas Limpas que executa um bloco de anotações que inclui a seguinte configuração de valor de tarefa:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
Crie uma tarefa subsequente que faça referência ao
output_schema
valor para processar a saída.