Explorar notebooks

Concluído

Os notebooks fornecem um ambiente interativo no qual você pode combinar texto e ilustrações no formato Markdown, com células contendo um código que você executa interativamente na sessão do notebook.

Como cientista de dados, você pode estar mais familiarizado com a escrita e a execução de código em notebooks. O Microsoft Fabric oferece uma experiência de notebook familiar, alimentada pelo Apache Spark.

No Microsoft Fabric, cientistas de dados, usuários corporativos e analistas trabalham todos na mesma plataforma, aprimorando o compartilhamento de dados e a colaboração em larga escala.

Uso de notebooks na ciência de dados

Os notebooks são uma ferramenta comum para cientistas de dados, já que permitem combinar código, textos explicativos e recursos multimídia em um único documento. Isso cria uma narrativa que pode promover a exploração ao facilitar o compartilhamento de códigos e uma prototipagem rápida.

Os notebooks também permitem que os cientistas de dados experimentem e compartilhem insights rapidamente por meio de uma rápida criação de ambientes.

Notebooks no Microsoft Fabric

Você pode começar a usar notebooks no Microsoft Fabric com zero esforço de instalação. Você pode criar um notebook ou importar um notebook existente. Você também pode selecionar diversos notebooks e importá-los em um lote.

Screenshot of the actions available in a Data Science workspace in Microsoft Fabric.

Os notebooks do Microsoft Fabric suportam atualmente quatro linguagens do Apache Spark:

  • PySpark (Python)
  • Spark (Scala)
  • Spark SQL
  • SparkR

Criar um notebook

Para criar um novo notebook, selecione a opção Novo na Página Inicial do seu workspace habilitado para o Fabric.

A captura de tela abaixo orienta você pelos principais componentes de um notebook no Fabric.

Screenshot of the options available in a Microsoft Fabric notebook.

  1. A barra de menus em um notebook do Microsoft Fabric oferece vários recursos. Permite que você salve e exporte seu notebook, gerencie células, encerre a sessão, agende a execução do seu notebook, inicie o Data Wrangler e ajuste o layout, entre outros. Para acessar todos esses recursos, basta alternar entre as guias Página Inicial, Editar, Executar, Dados e Visualização.

  2. Na guia Lakehouses, você pode adicionar um lakehouse novo ou existente a partir do Lakehouse Explorer. A guia Recursos fornece um armazenamento semelhante ao Unix para arquivos pequenos, como código, conjuntos de dados e imagens, acessíveis diretamente pelo notebook.

  3. Execute a célula atual. Alternativamente, você pode pressionar Ctrl+Enterou pressionar Alt+Enter para executar a célula atual e inserir uma nova célula.

  4. Adicione uma nova célula markdown ou de código. Essa opção também está disponível no menu quando você seleciona Editar -> Adicionar célula de código.

  5. Isso fornece várias opções para gerenciar uma célula específica, como reposicionar a célula dentro do notebook, convertê-la em uma célula markdown ou de código, limpar o resultado, adicionar comentários e muito mais.

Observação

Se você não conseguir encontrar a opção de notebook, isso pode ocorrer porque o locatário ou o workspace não foram habilitados para o Fabric. Para saber como habilitar o Fabric, confira Habilitar o Microsoft Fabric para a sua organização.

Trabalhar com dados em notebooks

Arrastar e soltar permite que você importe dados do Lakehouse Explorer com facilidade. Vários tipos de arquivo são suportados, como arquivos de texto, tabelas, imagens etc. Você pode soltar os dados em uma célula nova ou existente, e o notebook gera um snippet de código para visualizar os dados.

Example of the drag-and-drop feature generating the necessary code to read a file.

Além disso, você pode facilmente inserir imagens em uma célula markdown arrastando-as e soltando-as do seu navegador ou computador local.

Escrever código em notebooks

O IntelliSense aprimora a escrita de código e a identificação de erros com recursos como o realce de sintaxe, a marcação de erros e os preenchimentos de código automáticos. À medida que você digita, o IntelliSense prevê o que você está tentando escrever e oferece sugestões. Isso não só acelera a codificação, como também ajuda a evitar erros de digitação e a saber mais sobre chamadas à API.

Monitorar suas variáveis em notebooks

Não é raro, ao trabalhar em um notebook, ter centenas de variáveis, cada uma desempenhando um papel crucial em sua análise de dados ou desenvolvimento de modelos. Manter o controle de todas essas variáveis pode ser uma tarefa desafiadora. E é aí que o explorer de variáveis integradas no notebook do Microsoft Fabric entra em jogo.

À medida que você executa células de código no seu notebook de PySpark (Python) no Microsoft Fabric, as variáveis que você define são monitoradas e listadas automaticamente no explorer de variáveis. Isso permite que você veja o estado das suas variáveis a qualquer momento no seu processo de codificação.

Screenshot of the variable explorer in a Microsoft Fabric notebook.

Para cada variável, o explorer mostra o nome, tipo, comprimento e valor. Isso lhe fornece uma visão geral rápida de seus dados sem necessidade de imprimir ou registrar esses detalhes em log manualmente.

Gerenciar bibliotecas e dependências

No Microsoft Fabric, você pode gerenciar bibliotecas e dependências de duas maneiras: por meio de configurações do workspace ou em linha, dentro de um notebook.

Configurações do workspace

As bibliotecas instaladas no nível do workspace podem ser usadas por todos os notebooks e trabalhos do Spark nesse workspace e podem ser acessadas ao longo de diversas sessões. Portanto, se você precisar criar um ambiente comum para todas as sessões em um workspace, o melhor é usar bibliotecas no nível do workspace.

  1. No painel de navegação do lado esquerdo, selecione Workspaces. Você verá uma lista dos seus workspaces. Selecione o workspace com o qual você deseja trabalhar.

  2. Selecione as Configurações de workspace para seu workspace atual e, a seguir, selecione Engenharia/Ciência de Dados.

    Screenshot of the library management option in a Data Science workspace in Microsoft Fabric.

  3. Selecione Gerenciamento de bibliotecas para instalar tanto o feed do Python quanto bibliotecas personalizadas.

Instalação em linha

O comando %pip no Microsoft Fabric funciona da mesma forma que o comando do pip em muitos notebooks de ciência de dados. Use comandos %pip para instalar bibliotecas de feed diretamente no seu notebook.

Observação

Todas as bibliotecas instaladas com o comando %pip ficam disponíveis apenas para a sessão em curso. Além disso, a execução de um comando %pip irá reiniciar o interpretador do Python, o que significa que todas as variáveis definidas antes de executar o comando serão perdidas.

O comando %pip install é usado para instalar as versões mais recentes dessas bibliotecas. Em seguida, a instrução de importação é usada para importar essas bibliotecas para o ambiente atual do Python.

%pip install seaborn
%pip install sklearn

import seaborn as sns
from sklearn import datasets

Dica

É uma boa prática colocar todos os comandos para adicionar, excluir ou atualizar os pacotes do Python no início do seu notebook.

Colaborar em notebooks

O compartilhamento e a colaboração em notebooks permitem uma solução de problemas coletiva e maior eficiência em projetos de ciência de dados. Os notebooks do Microsoft Fabric oferecem um recurso poderoso, no qual vários usuários podem editar o mesmo documento simultaneamente. Essa funcionalidade é útil em situações como programação em par, solução remota de problemas e compartilhamento de conhecimento.

No nosso cenário, imagine que você e seu colega estão trabalhando em um projeto usando notebooks do Microsoft Fabric. Você está empacado em um pedaço de código e pede ajuda ao seu colega. Seu colega abre o mesmo notebook e você vê o perfil dele aparecer. À medida que seu colega revisa e edita o código, você pode ver os movimentos do cursor, as seleções e as alterações dele em tempo real. Esse feedback imediato ajuda você a identificar e entender a solução rapidamente.

Esse recurso de colaboração em tempo real dos notebooks do Microsoft Fabric não só ajuda você a solucionar seu problema de codificação, como também oferece uma excelente oportunidade para você aprender com seu colega mais experiente.

Para saber mais sobre todos os recursos disponíveis nos notebooks do Microsoft Fabric, confira Desenvolver, executar e gerenciar notebooks do Microsoft Fabric.