Introduzione: Eseguire query e visualizzare i dati da un notebook
Questo articolo introduttivo illustra l'uso di un notebook di Azure Databricks per eseguire query sui dati di esempio archiviati in Unity Catalog usando SQL, Python, Scala e R e quindi visualizzare i risultati della query nel notebook.
Requisiti
Per completare queste attività, è necessario soddisfare i requisiti seguenti:
- L'area di lavoro deve avere lo Unity Catalog abilitato. Per informazioni su come iniziare a usare Unity Catalog, vedere Configurare e gestire Unity Catalog.
- È necessario disporre dell'autorizzazione per usare una risorsa di calcolo esistente o creare una nuova risorsa di calcolo. Si veda Introduzione: configurazione dell'account e dell'area di lavoro o l'amministratore di Databricks.
Passaggio 1: Creare un nuovo notebook
Per creare un Notebook nell'area di lavoro, fare clic su Nuovo nella barra laterale e quindi su Notebook. Viene aperto un Notebook vuoto nell'area di lavoro.
Per altre informazioni sulla creazione e la gestione dei Notebook, vedere Gestire i Notebook.
Passaggio 2: Eseguire query su una tabella
Eseguire una query sulla samples.nyctaxi.trips
tabella in Unity Catalog usando il linguaggio preferito.
Copiare e incollare il codice seguente nella nuova cella vuota del Notebook. Questo codice visualizza i risultati dell'esecuzione di query sulla
samples.nyctaxi.trips
tabella nel catalogo unity.SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
Premere
Shift+Enter
per eseguire la cella e poi passare alla cella successiva.I risultati della query vengono visualizzati nel notebook.
Passaggio 3: Visualizzare i dati
Visualizzare l'importo medio della tariffa in base alla distanza della corsa, raggruppata in base al codice postale del ritiro.
Accanto alla scheda Tabella fare clic su + e poi su Visualizzazione.
Viene visualizzato l'editor di visualizzazione.
Nell'elenco a discesa Tipo di visualizzazione verificare che sia selezionata l'opzione Barra.
Selezionare
fare_amount
per la colonna X.Selezionare
trip_distance
per la colonna Y.Selezionare
Average
come tipo di aggregazione.Selezionare
pickup_zip
come colonna Raggruppa per .Fare clic su Salva.
Passaggi successivi
- Per informazioni sull'aggiunta di dati da un file CSV a Unity Catalog e sulla visualizzazione dei dati, vedere Introduzione: Importare e visualizzare i dati CSV da un notebook.
- Per informazioni su come caricare dati in Databricks con Apache Spark, vedere Esercitazione: Caricare e trasformare i dati con dataframe Apache Spark.
- Per altre informazioni sull'inserimento di dati in Databricks, vedere Inserire dati in un databricks lakehouse.
- Per altre informazioni sull'esecuzione di query sui dati con Databricks, vedere Eseguire query sui dati.
- Per altre informazioni sulle visualizzazioni, vedere Visualizzazioni nei notebook di Databricks.