Udostępnij za pośrednictwem


Get rozpocznij wysyłanie zapytań i wizualizowanie danych z notebooka

W tym artykule get rozpoczętym opisano używanie notesu usługi Azure Databricks do wykonywania zapytań dotyczących przykładowych danych przechowywanych w środowisku Unity Catalog przy użyciu języków SQL, Python, Scala i R, a następnie wizualizowania wyników zapytania w notesie.

Wymagania

Aby wykonać zadania opisane w tym artykule, musisz spełnić następujące wymagania:

  • Obszar roboczy musi mieć włączoną Unity Catalog. Aby uzyskać informacje na temat rozpoczynania pracy z CatalogUnity, zobacz SetCatalogi zarządzanie Unity.
  • Musisz mieć uprawnienia do używania istniejącego zasobu obliczeniowego lub utworzenia nowego zasobu obliczeniowego. Zobacz Get, jak rozpocząć pracę z Azure Databricks lub skontaktuj się z administratorem usługi Databricks.

Krok 1. Tworzenie nowego notesu

Aby utworzyć notes w obszarze roboczym, kliknij pozycję Nowa ikonaNowy na pasku bocznym, a następnie kliknij przycisk Notes. W obszarze roboczym zostanie otwarty pusty notes.

Aby dowiedzieć się więcej na temat tworzenia notesów i zarządzania nimi, zobacz Zarządzanie notesami.

Krok 2: Zadać pytanie dotyczące table

Wykonaj zapytanie dotyczące samples.nyctaxi.tripstable w środowisku Unity Catalog przy użyciu wybranego języka.

  1. Skopiuj i wklej następujący kod do nowej pustej komórki notesu. Ten kod wyświetla wyniki z wykonywania zapytań dotyczących samples.nyctaxi.tripstable w środowisku Unity Catalog.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Naciśnij , Shift+Enter aby uruchomić komórkę, a następnie przejdź do następnej komórki.

    Wyniki zapytania są wyświetlane w notesie.

Krok 3. Wyświetlanie danych

Wyświetl średnią kwotę taryfy według odległości podróży pogrupowane według kodu pocztowego odbioru.

  1. Obok karty Table kliknij pozycję +, a następnie kliknij pozycję Visualization.

    Zostanie wyświetlony edytor wizualizacji.

  2. Na liście rozwijanej Typ wizualizacji sprawdź, czy wybrano pasek .

  3. Select fare_amount dla X column.

  4. Select trip_distance dla Y column.

  5. Select Average jako typ agregacji.

  6. Select pickup_zip jako grupa wedługcolumn.

    Wykres słupkowy

  7. Kliknij przycisk Zapisz.

Następne kroki