Configurar o modo de alta simultaneidade para blocos de anotações de malha
Quando você executa um bloco de anotações no Microsoft Fabric, uma sessão do Apache Spark é iniciada e usada para executar as consultas enviadas como parte das execuções da célula do bloco de anotações. Com o Modo de Alta Simultaneidade ativado, não há necessidade de iniciar novas sessões de ignição sempre que executar um bloco de anotações.
Se você já tiver uma sessão de alta simultaneidade em execução, poderá anexar blocos de anotações à sessão de alta simultaneidade obtendo uma sessão de faísca instantaneamente para executar as consultas e obter uma maior taxa de utilização da sessão.
Nota
O compartilhamento de sessão baseado no modo de simultaneidade alta está sempre dentro de um único limite de usuário. Os blocos de anotações precisam ter configurações de faísca correspondentes, devem fazer parte do mesmo espaço de trabalho, compartilhar a mesma casa de lago padrão e bibliotecas para compartilhar uma única sessão de faísca.
Condições de partilha de sessões
Para que os blocos de notas partilhem uma única sessão do Spark, devem:
- Ser executado pelo mesmo usuário.
- Tenha a mesma casa de lago padrão. Blocos de anotações sem uma casa de lago padrão podem compartilhar sessões com outros blocos de anotações que não têm uma casa de lago padrão.
- Tenha as mesmas configurações de computação do Spark.
- Tenha os mesmos pacotes de biblioteca. Você pode ter diferentes instalações de biblioteca embutida como parte das células do bloco de anotações e ainda compartilhar a sessão com blocos de anotações com diferentes dependências de biblioteca.
Configurar o modo de simultaneidade alta
Por padrão, todos os espaços de trabalho de malha são habilitados com o Modo de simultaneidade alta. Use as seguintes etapas para configurar o recurso de alta simultaneidade:
Clique na opção Configurações do espaço de trabalho no espaço de trabalho do Fabric
Navegue até a seção> Engenharia de Dados/Ciência Configurações do Spark Alta>simultaneidade
Na seção Alta simultaneidade e habilite-a para blocos de anotações. Pode optar por ativar ou desativar a definição a partir deste painel.
Habilitar a opção de simultaneidade alta permite que os usuários iniciem uma sessão de simultaneidade alta em seus blocos de anotações ou anexem a uma sessão de simultaneidade alta existente.
A desativação do modo de simultaneidade alta oculta a seção para configurar o período de tempo de inatividade e também oculta a opção de iniciar uma nova sessão de simultaneidade alta no menu do bloco de anotações.
Executar blocos de anotações em sessão de alta simultaneidade
Abrir o espaço de trabalho Malha
Criar um Bloco de Anotações ou abrir um Bloco de Anotações existente
Navegue até a guia Executar na faixa de opções do menu e selecione na lista suspensa Tipo de sessão que tem Padrão selecionado como a opção padrão.
Selecione Nova sessão de simultaneidade alta.
Uma vez iniciada a sessão de simultaneidade alta, agora você pode adicionar até 5 blocos de anotações na sessão de simultaneidade alta.
Crie um novo bloco de anotações e, navegando até o menu Executar , conforme mencionado nas etapas acima, no menu suspenso você verá a sessão de alta simultaneidade recém-criada listada.
A seleção da sessão de alta simultaneidade existente anexa o segundo bloco de anotações à sessão.
Depois que o bloco de anotações for anexado, você poderá começar a executar as etapas do bloco de anotações instantaneamente.
O status de sessão de simultaneidade alta também mostra o número de blocos de anotações anexados a uma determinada sessão em qualquer momento.
A qualquer momento, se você achar que o bloco de anotações conectado a uma sessão de alta simultaneidade requer computação mais dedicada, você pode optar por alternar o bloco de anotações para uma sessão padrão selecionando a opção para desanexar o bloco de anotações da Simultaneidade Alta na guia do menu Executar.
Você pode visualizar o status da sessão, o tipo e o ID da sessão navegando até a barra de status , selecione o ID da sessão permite explorar os trabalhos executados nesta sessão de alta simultaneidade e visualizar os logs da sessão de faísca na página de detalhes de monitoramento.
Monitoramento e depuração de blocos de anotações em execução em sessão de alta simultaneidade
O monitoramento e a depuração geralmente são uma tarefa não trivial quando você está executando vários blocos de anotações em uma sessão compartilhada. Para o modo de alta simultaneidade no Fabric, a separação de logs é oferecida, o que permitiria aos usuários rastrear os logs emitidos por eventos de faísca de diferentes blocos de anotações.
Quando a sessão estiver em andamento ou em estado concluído, você poderá visualizar o status da sessão navegando até o menu Executar e selecionando a opção Todas as execuções
Isso abriria o histórico de execução do caderno mostrando a lista de sessões de faísca ativas e históricas atuais
Os usuários, selecionando uma sessão, podem acessar a exibição de detalhes de monitoramento, que mostra a lista de todos os trabalhos de faísca que foram executados na sessão.
No caso de sessão de alta simultaneidade, os usuários podem identificar os trabalhos e seus logs associados de diferentes blocos de anotações usando a guia Bloco de anotações relacionado, que mostra o bloco de anotações a partir do qual esse trabalho foi executado.
Conteúdos relacionados
Neste documento, você obtém uma compreensão básica de um compartilhamento de sessão por meio do modo de alta simultaneidade em blocos de anotações. Avance para os próximos artigos para saber como criar e começar com suas próprias experiências de Engenharia de Dados usando Lakehouse e Notebooks:
- Para começar a usar o Lakehouse, consulte Criando um Lakehouse.
- Para começar a utilizar os Blocos de Notas, consulte Como utilizar um Bloco de Notas