Primeiros passos: consultar e visualizar dados de um bloco de anotações
Este artigo de introdução orienta você pelo uso de um bloco de anotações do Azure Databricks para consultar dados de exemplo armazenados no Catálogo Unity usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no bloco de anotações.
Requisitos
Para concluir as tarefas neste artigo, você deve atender aos seguintes requisitos:
- Seu espaço de trabalho deve ter o Unity Catalog habilitado. Para obter informações sobre como começar a usar o Unity Catalog, consulte Configurar e gerenciar o Unity Catalog.
- Você deve ter permissão para usar um recurso de computação existente ou criar um novo recurso de computação. Consulte Introdução: Configuração de conta e espaço de trabalho ou consulte o administrador do Databricks.
Etapa 1: Criar um novo bloco de anotações
Para criar um bloco de notas na sua área de trabalho, clique em Novo na barra lateral e, em seguida, clique em Bloco de Notas. Um bloco de anotações em branco é aberto no espaço de trabalho.
Para saber mais sobre como criar e gerir blocos de notas, consulte Gerir blocos de notas.
Etapa 2: Consultar uma tabela
Consulte a samples.nyctaxi.trips
tabela no Catálogo Unity usando o idioma de sua escolha.
Copie e cole o código a seguir na nova célula vazia do bloco de anotações. Esse código exibe os resultados da consulta à
samples.nyctaxi.trips
tabela no Unity Catalog.SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
Pressione
Shift+Enter
para executar a célula e, em seguida, vá para a próxima célula.Os resultados da consulta aparecem no bloco de anotações.
Etapa 3: exibir os dados
Exiba o valor médio da tarifa por distância da viagem, agrupado pelo CEP de retirada.
Ao lado da guia Tabela , clique em e, em + seguida, clique em Visualização.
O editor de visualização é exibido.
Na lista suspensa Tipo de visualização, verifique se Barra está selecionada.
Selecione
fare_amount
a coluna X.Selecione
trip_distance
para a coluna Y.Selecione
Average
como o tipo de agregação.Selecione
pickup_zip
como a coluna Agrupar por .Clique em Guardar.
Próximos passos
- Para saber mais sobre como adicionar dados do arquivo CSV ao Catálogo Unity e visualizar dados, consulte Introdução: importar e visualizar dados CSV de um bloco de anotações.
- Para saber como carregar dados no Databricks usando o Apache Spark, consulte Tutorial: Carregar e transformar dados usando o Apache Spark DataFrames.
- Para saber mais sobre como ingerir dados em Databricks, consulte Ingerir dados em uma casa de lago Databricks.
- Para saber mais sobre como consultar dados com Databricks, consulte Consultar dados.
- Para saber mais sobre visualizações, consulte Visualizações em blocos de anotações Databricks.