Introduzione: Eseguire query e visualizzare i dati da un notebook

Articolo
02/23/2025

Questo articolo introduttivo illustra l'uso di un notebook di Azure Databricks per eseguire query sui dati di esempio archiviati in Unity Catalog usando SQL, Python, Scala e R e quindi visualizzare i risultati della query nel notebook.

Requisiti

Per completare queste attività, è necessario soddisfare i requisiti seguenti:

L'area di lavoro deve avere il Catalogo Unity abilitato. Per informazioni su come iniziare a usare Unity Catalog, vedere Configurare e gestire Il catalogo Unity.
È necessario disporre dell'autorizzazione per usare una risorsa di calcolo esistente o creare una nuova risorsa di calcolo. Consultare Introduzione ad Azure Databricks o consultare l'amministratore di Databricks.

Passaggio 1: Creare un nuovo notebook

Per creare un Notebook nell'area di lavoro, fare clic su Nuovo nella barra laterale e quindi su Notebook. Viene aperto un Notebook vuoto nell'area di lavoro.

Per altre informazioni sulla creazione e la gestione dei Notebook, vedere Gestire i Notebook.

Passaggio 2: Eseguire query su una tabella

Eseguire una query sulla tabella samples.nyctaxi.trips in Unity Catalog usando il linguaggio preferito.

Copiare e incollare il codice seguente nella nuova cella vuota del Notebook. Questo codice visualizza i risultati della query sulla tabella samples.nyctaxi.trips in Unity Catalog.

SQL

SELECT * FROM samples.nyctaxi.trips

Python

display(spark.read.table("samples.nyctaxi.trips"))

Scala

display(spark.read.table("samples.nyctaxi.trips"))

R

library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))

Premere Shift+Enter per eseguire la cella e poi passare alla cella successiva.

I risultati della query vengono visualizzati nel notebook.

Passaggio 3: Visualizzare i dati

Visualizzare l'importo medio della tariffa in base alla distanza della corsa, raggruppata in base al codice postale del ritiro.

Accanto alla scheda tabella fare clic su e quindi su Visualizzazione.

Viene visualizzato l'editor di visualizzazione.
Nell'elenco a discesa Tipo di visualizzazione verificare che sia selezionata l'opzione Barra.
Selezionare fare_amount per la colonna X.
Selezionare trip_distance per la colonna Y.
Selezionare Average come tipo di aggregazione.
Selezionare pickup_zip come colonna Raggruppa per.
Fare clic su Salva.

Passaggi successivi

Per informazioni sull'aggiunta di dati dal file CSV al catalogo Unity e sulla visualizzazione dei dati, vedere Introduzione: Importare e visualizzare i dati CSV da un notebook.
Per informazioni su come caricare dati in Databricks con Apache Spark, vedere Esercitazione: Caricare e trasformare i dati con dataframe Apache Spark.
Per ulteriori informazioni sull'ingestione di dati in Databricks, vedere Ingerire dati in un'architettura lakehouse di Azure Databricks.
Per altre informazioni sull'esecuzione di query sui dati con Databricks, vedere Eseguire query sui dati.
Per altre informazioni sulle visualizzazioni, vedere Visualizzazioni nei notebook di Databricks.
Per altre informazioni sulle tecniche di analisi esplorativa dei dati (EDA), vedere Tutorial: EDA techniques using Databricks notebooks.

Condividi tramite