Sdílet prostřednictvím


Začínáme: Dotazování a vizualizace dat z poznámkového bloku

Tento úvodní článek vás provede použitím poznámkového bloku Azure Databricks k dotazování ukázkových dat uložených v Katalogu Unity pomocí SQL, Pythonu, Scaly a R a následné vizualizace výsledků dotazu v poznámkovém bloku.

Požadavky

K dokončení úkolů v tomto článku musíte splňovat následující požadavky:

  • Váš pracovní prostor musí mít povolený katalog Unity. Informace o tom, jak začít s katalogem Unity, najdete v tématu Nastavení a správa katalogu Unity.
  • Musíte mít oprávnění k používání existujícího výpočetního prostředku nebo k vytvoření nového výpočetního prostředku. Viz Začínáme: Nastavení účtu a pracovního prostoru nebo se obraťte na správce Databricks.

Krok 1: Vytvoření nového poznámkového bloku

Chcete-li vytvořit poznámkový blok v pracovním prostoru, klepněte na tlačítko Nová ikona Nový na bočním panelu a potom klepněte na příkaz Poznámkový blok. V pracovním prostoru se otevře prázdný poznámkový blok.

Další informace o vytváření a správě poznámkových bloků najdete v tématu Správa poznámkových bloků.

Krok 2: Dotazování na tabulku

Dotazování tabulky samples.nyctaxi.trips v katalogu Unity pomocí jazyka podle vašeho výběru

  1. Zkopírujte a vložte následující kód do nové prázdné buňky poznámkového bloku. Tento kód zobrazí výsledky dotazování samples.nyctaxi.trips tabulky v katalogu Unity.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Stisknutím klávesy Shift+Enter spusťte buňku a přejděte na další buňku.

    Výsledky dotazu se zobrazí v poznámkovém bloku.

Krok 3: Zobrazení dat

Zobrazí průměrnou částku jízdného podle vzdálenosti jízdy seskupené podle PSČ vyzvednutí.

  1. Vedle karty Tabulka klikněte a + potom klikněte na Vizualizace.

    Zobrazí se editor vizualizací.

  2. V rozevíracím seznamu Typ vizualizace ověřte, že je vybraný pruh .

  3. Vyberte fare_amount sloupec X.

  4. Vyberte trip_distance sloupec Y.

  5. Vyberte Average jako typ agregace.

  6. Vyberte pickup_zip jako sloupec Seskupovat podle .

    Pruhový graf

  7. Klikněte na Uložit.

Další kroky