Compartilhar via


Executar notebooks em clean rooms

Importante

Esse recurso está em uma versão prévia.

Este artigo descreve como executar notebooks em clean rooms. Notebooks são a interface que os colaboradores usam para executar a análise de dados em colaboração.

Para saber como adicionar um notebook a um clean room, consulte Como criar clean rooms.

Antes de começar

Para executar um notebook em um clean room, você deve ser:

  • O proprietário do clean room ou ter o privilégio EXECUTE CLEAN ROOM TASK no clean room.
  • Um colaborador que não criou o notebook. O criador do notebook não pode executá-lo. Isso impõe a aprovação implícita do notebook por ambas as partes.

Observação

O criador é designado automaticamente como proprietário da Clean Room em sua conta do Databricks. O administrador do metastore da organização colaboradora é automaticamente designado como proprietário da Clean Room em sua conta do Databricks. Você pode transferir a propriedade. Consulta Gerenciar a propriedade do objeto do Catálogo do Unity.

Executar um notebook em um clean room

Para executar um notebook em um clean room, você deve usar o Explorador de Catálogos.

  1. No workspace do Azure Databricks, clique em Ícone do catálogo Catálogo.

  2. Na parte superior do painel Catálogo, clique no ícone de engrenagem ícone de engrenagem e selecione Clean Rooms.

    Como alternativa, na página Acesso rápido, clique no botão Clean Rooms >.

  3. Selecione o clean room na lista.

  4. Em Notebooks, clique no notebook para abri-lo no modo de visualização.

  5. Clique no botão Executar.

    Você só pode executar notebooks compartilhados por outro colaborador.

  6. (Opcional) Na caixa de diálogo Executar notebook com parâmetros , clique em + Adicionar para passar valores de parâmetro para a tarefa de trabalho do notebook.

    Para obter mais informações sobre parâmetros para tarefas de trabalho, confira Parametrizar trabalhos.

  7. Clique na caixa de seleção de confirmação.

  8. Clique em Executar.

  9. Clique em Ver detalhes para exibir o progresso da execução.

    Como alternativa, você pode exibir o progresso da execução indo até Execuções nesta página ou clicando em Fluxos de Trabalho na barra lateral do workspace e indo até a guia Execuções do trabalho.

  10. Exiba os resultados da execução do notebook.

    Os resultados do notebook são exibidos após a conclusão da execução. Para exibir as execuções anteriores, vá para Execuções e clique no link na coluna Hora de início.

Compartilhar a saída do notebook usando tabelas de saída

As tabelas de saída são tabelas temporárias somente leitura geradas por uma execução de notebook e compartilhadas com o metastore do executor de notebook. Se o notebook criar uma tabela de saída, o executor do notebook poderá acessá-la em um catálogo de saída e compartilhá-la com outros usuários em seu workspace. Consulte Criar e trabalhar com tabelas de saída em Clean Rooms do Databricks.

Usar fluxos de trabalho do Azure Databricks para executar notebooks de sala limpa

Você pode usar trabalhos do Azure Databricks para executar notebooks e executar tarefas em tabelas de saída, permitindo que você crie fluxos de trabalho complexos que envolvem seus ativos de sala limpa. Esses recursos, em particular, tornam esses fluxos de trabalho possíveis:

Por exemplo, você pode criar um fluxo de trabalho que propaga o nome do esquema de saída gerado dinamicamente entre tarefas, fazendo o seguinte:

  1. Crie uma tarefa do tipo de tarefa Bloco de anotações Salas Limpas que executa um bloco de anotações que inclui a seguinte configuração de valor de tarefa:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Crie uma tarefa subsequente que faça referência ao output_schema valor para processar a saída.