Freigeben über


Erste Schritte: Abfragen und Visualisieren von Daten aus einem Notebook

Dieser Einführungsartikel führt Sie durch die Verwendung eines Azure Databricks-Notebooks zum Abfragen von Beispieldaten, die in Unity Catalog gespeichert sind, mit SQL, Python, Scala und R, und das anschließende Visualisieren der Abfrageergebnisse im Notebook.

Anforderungen

Um die Aufgaben in diesem Artikel abzuschließen, müssen die folgenden Anforderungen erfüllt sein:

Schritt 1: Erstellen eines neuen Notebooks

Wenn Sie ein Notebook in Ihrem Arbeitsbereich erstellen möchten, wählen Sie in der Randleiste Neues SymbolNeu aus, und wählen Sie dann Notebook aus. Im Arbeitsbereich wird ein leeres Notebook geöffnet.

Weitere Informationen zum Erstellen und Verwalten von Notebooks finden Sie unter Verwalten von Notebooks.

Schritt 2: Abfragen einer Tabelle

Fragen Sie die Tabelle samples.nyctaxi.trips in Unity Catalog mithilfe Ihrer bevorzugten Sprache ab.

  1. Kopieren Sie den folgenden Code, und fügen Sie ihn in die neue leere Notebookzelle ein. Dieser Code zeigt die Ergebnisse der Abfrage der Tabelle samples.nyctaxi.trips in Unity Catalog an.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Drücken Sie Shift+Enter, um die Zelle auszuführen, und wechseln Sie dann zur nächsten Zelle.

    Die Abfrageergebnisse werden im Notebook angezeigt.

Schritt 3: Anzeigen der Daten

Zeigen Sie den durchschnittlichen Fahrpreis nach Fahrstrecke an, gruppiert nach der Postleitzahl des Startpunkts.

  1. Klicken Sie neben der Registerkarte Tabelle auf + und klicken Sie dann auf Visualisierung.

    Der Visualisierungs-Editor wird angezeigt.

  2. Vergewissern Sie sich, dass in der Dropdownliste VisualisierungstypLeiste ausgewählt ist.

  3. Wählen Sie fare_amount für die X-Spalte aus.

  4. Wählen Sie trip_distance für die Y-Spalte aus.

  5. Wählen Sie Average als Aggregationstyp aus.

  6. Wählen Sie pickup_zip als Gruppieren nach-Spalte aus, nach der gruppiert werden soll.

    Balkendiagramm

  7. Klicken Sie auf Speichern.

Nächste Schritte