Visualizações em blocos de anotações Databricks
O Azure Databricks tem suporte interno para gráficos e visualizações no Databricks SQL e em blocos de anotações. Esta página descreve como trabalhar com visualizações em um bloco de anotações Databricks. Para obter informações sobre como usar visualizações no Databricks SQL, consulte Visualização no Databricks SQL.
Para exibir os tipos de visualizações, consulte Tipos de visualização.
Criar uma nova visualização
Para recriar o exemplo nesta seção, use o seguinte código:
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Para criar uma visualização, clique + acima de um resultado e selecione Visualização. O editor de visualização é exibido.
Na lista suspensa Tipo de visualização, escolha um tipo.
Selecione os dados a serem exibidos na visualização. Os campos disponíveis dependem do tipo selecionado.
Clique em Guardar.
Criar um novo perfil de dados
Nota
Disponível em Databricks Runtime 9.1 LTS e superior.
Os perfis de dados exibem estatísticas resumidas de um Apache Spark DataFrame, um pandas DataFrame ou uma tabela SQL em formato tabular e gráfico. Para criar um perfil de dados a partir de uma célula de resultados, clique em + e selecione Perfil de Dados.
O Azure Databricks calcula e exibe as estatísticas de resumo.
- As características numéricas e categóricas são mostradas em tabelas separadas.
- Na parte superior do separador, pode ordenar ou procurar funcionalidades.
- Na parte superior da coluna do gráfico, você pode optar por exibir um histograma (padrão ) ou quantis.
- Marque expandir para ampliar os gráficos.
- Verifique o log para exibir os gráficos em uma escala de log.
- Você pode passar o cursor sobre os gráficos para obter informações mais detalhadas, como os limites de uma coluna de histograma e o número de linhas nela ou o valor quantílico.
Você também pode gerar perfis de dados programaticamente; Consulte comando summarize (dbutils.data.summarize).
Trabalhar com visualizações e perfis de dados
Nota
Os perfis de dados estão disponíveis no Databricks Runtime 9.1 LTS e superior.
Renomear, duplicar ou remover uma visualização ou perfil de dados
Para renomear, duplicar ou remover uma visualização ou um perfil de dados, clique na seta para baixo à direita do nome da guia. Você também pode criar um painel no menu.
Nota
Se a célula contiver um perfil de dados, a visualização associada e o perfil de dados só poderão ser adicionados a um dashboard do notebook. Para células com apenas visualizações, verá um item de menu Adicionar ao painel adicional no menu suspenso. Consulte Adicionar uma visualização a um painel.
Você também pode alterar o nome clicando diretamente nele e editando o nome no local.
Editar uma visualização
Clique abaixo da visualização para abrir o editor de visualização. Quando terminar de fazer alterações, clique em Salvar.
Editar cores
Você pode personalizar as cores de uma visualização ao criá-la ou editando-a.
- Crie ou edite uma visualização.
- Clique em Cores.
- Para modificar uma cor, clique no quadrado e selecione a nova cor seguindo um destes procedimentos:
- Clique nele no seletor de cores.
- Insira um valor hexadecimal.
- Clique em qualquer lugar fora do seletor de cores para fechá-lo.
- Clique
Salvar no Editor de Visualizaçãopara salvar as alterações.
Seleção de séries
Para selecionar uma série específica para analisar em um gráfico, use os seguintes comandos:
- Clique em um único item de legenda para selecionar essa série
- Cmd/Ctrl + clique em um item de legenda para selecionar ou desmarcar várias séries
seleção da série
Dicas de ferramentas ordenadas
Use dicas de ferramentas em gráficos de linhas e gráficos de barras não empilhados, ordenados por magnitude, para facilitar a análise.
Ampliar
Para gráficos densos em dados, ampliar pontos de dados individuais pode ser útil para investigar detalhes e cortar valores atípicos. Para ampliar um gráfico, clique e arraste na tela. Para limpar o zoom, passe o mouse sobre a tela e clique no botão Limpar zoom no canto superior direito da visualização.
Baixar uma visualização como um arquivo PNG
Para carregar uma visualização como um arquivo PNG, passe o mouse sobre a tela e clique no ícone de download no canto superior direito.
Um arquivo png é baixado para o seu dispositivo.
Adicionar uma visualização a um dashboard
- Clique na seta para baixo à direita do nome da guia.
- Selecione Adicionar ao painel. É apresentada uma lista de vistas de dashboard disponíveis, juntamente com uma opção de menu Adicionar a um novo dashboard.
- Selecione um painel ou selecione Adicionar ao novo painel. O painel é exibido, incluindo a visualização recém-adicionada.
Visualizações herdadas
A versão mais recente das visualizações de gráficos está ativada por padrão. As configurações nesta seção descrevem a visualização herdada que você pode encontrar ao trabalhar com um gráfico mais antigo ou se tiver a versão mais recente desativada.
Ferramentas de visualização
Se você passar o mouse sobre o canto superior direito de um gráfico, será exibida uma barra de ferramentas Plotly onde você poderá executar operações como selecionar, ampliar e deslocar.
Baixar uma visualização
Para baixar uma visualização em formato .png, clique no ícone da câmera na célula do bloco de anotações ou no editor de visualização.
Numa célula de resultados, o ícone da câmara aparece no canto superior direito quando move o cursor sobre a célula.
No editor de visualização, o ícone da câmera aparece quando você move o cursor sobre o gráfico. Consulte Ferramentas de visualização.
Ocultar ou mostrar temporariamente uma série
Para ocultar uma série em uma visualização, clique na série na legenda. Para mostrar a série novamente, clique nela novamente na legenda.
Para mostrar apenas uma única série, clique duas vezes na série na legenda. Para mostrar outras séries, clique em cada uma delas.