Compartilhar via


Visualizações em notebooks do Databricks

O Azure Databricks tem suporte integrado para gráficos e visualizações no Databricks SQL e em notebooks. Esta página descreve como trabalhar com visualizações em um notebook do Databricks. Para obter informações sobre como usar visualizações no SQL do Databricks, consulte Visualização no SQL do Databricks.

Para exibir os tipos de visualizações, consulte tipos de visualização.

Criar uma nova visualização

Para recriar o exemplo nesta seção, use o seguinte código:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

Para criar uma visualização, clique em + acima de um resultado e selecione Visualização. O editor de visualização é exibido.

Menu de nova visualização

  1. Na lista de opções Tipo de visualização, escolha um tipo.

    Editor de visualização

  2. Selecione os dados a serem exibidos na visualização. Os campos disponíveis dependem do tipo selecionado.

  3. Clique em Save (Salvar).

Criar um perfil de dados

Observação

Disponível no Databricks Runtime 9.1 LTS e superior.

Os perfis de dados exibem estatísticas resumidas de um DataFrame do Apache Spark, um Pandas DataFrame ou uma tabela SQL em formato gráfico e tabular. Para criar um perfil de dados a partir de uma célula de resultados, clique em + e selecione Perfil de dados.

O Azure Databricks calcula e exibe as estatísticas de resumo.

Perfil de dados

  • Os recursos numéricos e categóricos são mostrados em tabelas separadas.
  • Na parte superior da guia, você pode classificar ou pesquisar recursos.
  • Na parte superior da coluna do gráfico, você pode optar por exibir um histograma (padrão) ou os quantis.
  • Marque Expandir para ampliar os gráficos.
  • Verifique o log para ver os gráficos em uma escala de log.
  • Posicione o cursor sobre os gráficos para obter informações mais detalhadas, como os limites de uma coluna de histograma e o número de linhas nele ou o valor de quantil.

Você também pode gerar perfis de dados por meio de programação. Confira Comando summarize (dbutils.data.summarize).

Trabalhar com visualizações e perfis de dados

Observação

Os perfis de dados estão disponíveis no Databricks Runtime 9.1 LTS e superior.

Renomear, duplicar ou remover um perfil de visualização ou dados

Para renomear, duplicar ou remover uma visualização ou perfil de dados, clique na seta apontando para baixo à direita do nome da guia. Você também pode criar um painel no menu.

Observação

Se a célula contiver um perfil de dados, a visualização associada e o perfil de dados só poderão ser adicionados a um painel de notebook. Para células com apenas visualizações, você verá um item de menu adicional Adicionar ao painel na lista suspensa. Consulte Adicionar uma visualização a um painel.

menu suspenso do perfil de dados do Notebook Menu suspenso de perfil de dados do notebook

Você também pode alterar o nome clicando diretamente nele e editando o nome no local.

Editar uma visualização

Clique no botão Editar visualização abaixo da visualização para abrir o editor de visualização. Quando você terminar de fazer alterações, clique em Salvar.

Editar cores

Você pode personalizar as cores de uma visualização ao criar a visualização ou editá-la.

  1. Criar ou editar uma visualização.
  2. Clique em Cores.
  3. Para modificar uma cor, clique no quadrado e selecione a nova cor fazendo um dos seguintes:
    • Clique nele no seletor de cores.
    • Insira um valor hexadecimal.
  4. Clique em qualquer lugar fora do seletor de cores para fechá-lo.
  5. Clique em Salvar no Editor de visualização para salvar as alterações.

Seleção de série

Para selecionar uma série específica para analisar em um gráfico, use os seguintes comandos:

  • Clique em um único item de legenda para selecionar essa série
  • Cmd/Ctrl + clique em um item de legenda para selecionar ou desmarcar várias séries

Seleção da Série Seleção de série

Dicas de ferramentas ordenadas

Use dicas de ferramentas em gráficos de linhas e gráficos de barras não mapeados, ordenados por magnitude, para uma análise mais fácil.

dicas de ferramentas classificadas

Zoom

Para gráficos densos de dados, ampliar pontos de dados individuais pode ser útil para investigar detalhes e cortar exceções. Para ampliar um gráfico, clique e arraste na tela. Para limpar o zoom, passe o mouse sobre a tela e clique no botão Limpar zoom no canto superior direito da visualização.

ampliar para ver os detalhes

Baixar uma visualização como um arquivo PNG

Para carregar uma visualização como um arquivo PNG, passe o mouse sobre a tela e clique no ícone de download no canto superior direito.

Clique em baixar para exportar a visualização como um arquivo PNG

Um arquivo png é baixado em seu dispositivo.

Adicionar uma visualização a um dashboard

  1. Clique na seta apontando para baixo à direita do nome da guia.
  2. Selecione Adicionar ao painel. Uma lista de exibições de painel disponíveis é exibida, juntamente com uma opção de menu Adicionar ao novo painel.
  3. Selecione um painel ou selecione Adicionar ao novo painel. O painel é exibido, incluindo a visualização recém-adicionada.

Visualizações herdadas

A versão mais recente das visualizações do gráfico está ativada por padrão. As configurações nesta seção descrevem a visualização herdada que você pode encontrar ao trabalhar com um gráfico mais antigo ou se você tiver a versão mais recente desativada.

Ferramentas de visualização

Se você passar o mouse sobre o canto superior direito de um gráfico, será exibida uma barra de ferramentas Plotly em que você pode executar operações como selecionar, ampliar e pan.

Barra de ferramentas do editor de visualização do notebook

Baixar uma visualização

Para baixar uma visualização no formato .png, clique no ícone da câmeraícone da câmerana célula do notebook ou no editor de visualização.

  • Em uma célula de resultado, o ícone da câmera aparece no canto superior direito quando você move o cursor sobre a célula.

    câmera em célula do notebook

  • No editor de visualização, o ícone da câmera aparece quando você move o cursor sobre o gráfico. Consultar Ferramentas de visualização.

Ocultar ou mostrar temporariamente uma série

Para ocultar uma série em uma visualização, clique nela na legenda. Para mostrar a série novamente, clique novamente nela na legenda.

Para mostrar apenas uma única série, clique duas vezes nela na legenda. Para mostrar outras séries, clique em cada uma delas.