Partilhar via


Executar blocos de anotações em salas limpas

Este artigo descreve como executar blocos de anotações em salas limpas. Os blocos de anotações são a interface que os colaboradores usam para executar a análise de dados em colaboração.

Para saber como adicionar um bloco de notas a uma sala limpa, consulte Criar salas limpas.

Antes de começar

Para executar um bloco de anotações em uma sala limpa, você deve ser:

  • O proprietário da sala limpa ou ter o EXECUTE CLEAN ROOM TASK privilégio na sala limpa.
  • Um colaborador que não criou o caderno. O criador do bloco de notas não pode executar o bloco de notas. Isso impõe a aprovação implícita do caderno por ambas as partes.

Nota

O criador é automaticamente atribuído como o proprietário da sala limpa em sua conta Databricks. O administrador do metastore da organização colaboradora recebe automaticamente a propriedade da sala limpa em sua conta Databricks. Você pode transferir a propriedade. Consulte Gerir a propriedade do objeto do Unity Catalog.

Executar um bloco de notas numa sala limpa

Para executar um caderno numa sala limpa, deverá usar o Explorador de Catálogos.

  1. No seu espaço de trabalho do Azure Databricks, clique ícone CatálogoCatálogo.

  2. Na parte superior do painel Catálogo , clique no ícone de engrenagem e selecione Salas Limpas .

    Como alternativa, na página Acesso rápido , clique no botão Salas > limpas.

  3. Selecione a sala limpa na lista.

  4. Em Blocos de Notas, clique no bloco de notas para o abrir no modo de pré-visualização.

  5. Clique no botão Run (Executar).

    Você só pode executar blocos de anotações que o outro colaborador compartilhou.

  6. (Opcional) Na caixa de diálogo Executar bloco de anotações com parâmetros, clique em + Adicionar para passar valores de parâmetro para a tarefa de trabalho do bloco de anotações.

  7. Clique na caixa de seleção de confirmação.

  8. Clique em Executar.

  9. Clique em Ver detalhes para ver o progresso da execução.

    Como alternativa, você pode exibir o progresso da execução indo para Execuções nesta página ou clicando em Fluxos de Trabalho na barra lateral do espaço de trabalho e indo para a guia Execução de trabalho.

  10. Exiba os resultados da execução do bloco de anotações.

    Os resultados do bloco de anotações aparecem após a conclusão da execução. Para ver execuções anteriores, aceda a Execuções e clique na ligação na coluna Hora de início.

Nota

Os parâmetros cr_creator_input_catalog e cr_collaborator_input_catalog são passados automaticamente para o notebook da sala limpa durante a execução. Você pode usar esses parâmetros para testes locais com tabelas de exemplo. Para obter mais informações sobre parâmetros para tarefas de trabalho, consulte Parametrizar trabalhos.

Partilhar a saída do notebook usando tabelas de resultados

As tabelas de resultados são tabelas temporárias somente leitura geradas por uma execução de bloco de notas e compartilhadas com o metastore do executor do bloco de notas. Se o caderno criar uma tabela de saída, o executante do caderno pode aceder a ela num catálogo de saída e compartilhá-la com outros utilizadores no espaço de trabalho deles. Consulte Criar e Trabalhar com Tabelas de Saída no Databricks Clean Rooms.

Usar os Fluxos de Trabalho do Azure Databricks para executar blocos de anotações de sala limpa

Você pode usar trabalhos do Azure Databricks para executar blocos de anotações e executar tarefas em tabelas de saída, permitindo que você crie fluxos de trabalho complexos que envolvem seus ativos de sala limpa. Esses recursos, em particular, tornam esses fluxos de trabalho possíveis:

  • O tipo de tarefa Clean Room notebook permite selecionar e executar um notebook de sala limpa como uma tarefa em Workflows. Consulte Tarefa do bloco de anotações de Sala Limpa para trabalhos.
  • As execuções de notebooks iniciadas pelo fluxo de trabalho podem gerar tabelas de saída que podem ser referenciadas por outras tarefas do fluxo de trabalho . Consulte Criar e Trabalhar com Tabelas de Saída no Databricks Clean Rooms.
  • Os fluxos de trabalho podem usar valores da tarefa que passar valores de parâmetros do trabalho para cadernos de sala limpa ou capturar a saída dos cadernos de sala limpa e passar essa saída para outras tarefas do fluxo de trabalho. Consulte Usar valores de tarefa para passar informações entre tarefas.
  • O nome do esquema de saída da sala limpa é gerado automaticamente. Se você incluir {{tasks.<your_task_name>.output.schema_name}} e {{tasks.<your_task_name>.output.catalog_name}} nos parâmetros, poderá fazer referência a esses valores de uma sala limpa quando ela for executada em uma tarefa de bloco de anotações downstream. Aceda a uma tarefa do bloco de notas e, em Parâmetros, selecione os seus valores.

Por exemplo, você pode criar um fluxo de trabalho que propaga o nome do esquema de saída gerado dinamicamente entre tarefas, fazendo o seguinte:

  1. Crie uma tarefa do tipo tarefa Bloco de anotações de Salas Limpas que execute um bloco de anotações que inclua a seguinte configuração de valor de tarefa:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Crie uma tarefa subsequente que faça referência ao output_schema valor para processar a saída.