Executar blocos de anotações em salas limpas
Importante
Esta funcionalidade está em Pré-visualização Pública.
Este artigo descreve como executar blocos de anotações em salas limpas. Os blocos de anotações são a interface que os colaboradores usam para executar a análise de dados em colaboração.
Para saber como adicionar um bloco de notas a uma sala limpa, consulte Criar salas limpas.
Antes de começar
Para executar um bloco de anotações em uma sala limpa, você deve ser:
- O proprietário da sala limpa ou ter o
EXECUTE CLEAN ROOM TASK
privilégio na sala limpa. - Um colaborador que não criou o caderno. O criador do bloco de notas não pode executar o bloco de notas. Isso impõe a aprovação implícita do caderno por ambas as partes.
Nota
O criador é automaticamente atribuído como o proprietário da sala limpa em sua conta Databricks. O administrador do metastore da organização colaboradora recebe automaticamente a propriedade da sala limpa em sua conta Databricks. Você pode transferir a propriedade. Consulte Gerenciar a propriedade do objeto do Catálogo Unity.
Executar um bloco de notas numa sala limpa
Para executar um bloco de anotações em uma sala limpa, você deve usar o Gerenciador de Catálogos.
No seu espaço de trabalho do Azure Databricks, clique em Catálogo.
Na parte superior do painel Catálogo, clique no ícone de engrenagem e selecione Salas limpas.
Como alternativa, na página Acesso rápido , clique no botão Salas > limpas.
Selecione a sala limpa na lista.
Em Blocos de Notas, clique no bloco de notas para o abrir no modo de pré-visualização.
Clique no botão Run (Executar).
Você só pode executar blocos de anotações que o outro colaborador compartilhou.
(Opcional) Na caixa de diálogo Executar bloco de anotações com parâmetros , clique em + Adicionar para passar valores de parâmetro para a tarefa de trabalho do bloco de anotações.
Para obter mais informações sobre parâmetros para tarefas de trabalho, consulte Parametrizar trabalhos.
Clique na caixa de seleção de confirmação.
Clique em Executar.
Clique em Ver detalhes para ver o progresso da execução.
Como alternativa, você pode exibir o progresso da execução indo para Execuções nesta página ou clicando em Fluxos de Trabalho na barra lateral do espaço de trabalho e indo para a guia Execução de trabalho.
Exiba os resultados da execução do bloco de anotações.
Os resultados do bloco de anotações aparecem após a conclusão da execução. Para ver execuções anteriores, vá para Execuções e clique no link na coluna Hora de início.
Compartilhar a saída do bloco de anotações usando tabelas de saída
As tabelas de saída são tabelas temporárias somente leitura geradas por uma execução de bloco de anotações e compartilhadas com o metastore do corredor do bloco de anotações. Se o bloco de anotações criar uma tabela de saída, o executor do bloco de anotações poderá acessá-la em um catálogo de saída e compartilhá-la com outros usuários em seu espaço de trabalho. Consulte Criar e trabalhar com tabelas de saída em Salas limpas do Databricks.
Usar os Fluxos de Trabalho do Azure Databricks para executar blocos de anotações de sala limpa
Você pode usar trabalhos do Azure Databricks para executar blocos de anotações e executar tarefas em tabelas de saída, permitindo que você crie fluxos de trabalho complexos que envolvem seus ativos de sala limpa. Esses recursos, em particular, tornam esses fluxos de trabalho possíveis:
- O tipo de tarefa Bloco de anotações de Sala Limpa permite selecionar e executar um bloco de anotações de sala limpa como uma tarefa de Fluxos de trabalho. Consulte Tarefa do bloco de anotações de Sala Limpa para trabalhos.
- As execuções de bloco de anotações iniciadas pelo fluxo de trabalho podem gerar tabelas de saída que podem ser referenciadas por outras tarefas do fluxo de trabalho. Consulte Criar e trabalhar com tabelas de saída em Salas limpas do Databricks.
- Os fluxos de trabalho podem usar valores de Tarefa que passam valores de parâmetros de trabalho para blocos de anotações de sala limpa ou capturam a saída de bloco de anotações de sala limpa e passam essa saída para outras tarefas de fluxo de trabalho. Consulte Usar valores de tarefa para passar informações entre tarefas.
Por exemplo, você pode criar um fluxo de trabalho que propaga o nome do esquema de saída gerado dinamicamente entre tarefas, fazendo o seguinte:
Crie uma tarefa do tipo tarefa Bloco de anotações de Salas Limpas que execute um bloco de anotações que inclua a seguinte configuração de valor de tarefa:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
Crie uma tarefa subsequente que faça referência ao
output_schema
valor para processar a saída.