Dela via


Visualiseringar i Databricks-notebook-filer

Azure Databricks har inbyggt stöd för diagram och visualiseringar i både Databricks SQL och i notebook-filer. Den här sidan beskriver hur du arbetar med visualiseringar i en Databricks-notebook-fil. Information om hur du använder visualiseringar i Databricks SQL finns i Visualisering i Databricks SQL.

Information om hur du visar typer av visualiseringar finns i visualiseringstyper.

Skapa en ny visualisering

Om du vill återskapa exemplet i det här avsnittet använder du följande kod:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

Om du vill skapa en visualisering klickar du på + ovanför ett resultat och väljer Visualisering. Visualiseringsredigeraren visas.

Ny visualiseringsmeny

  1. I listrutan Visualiseringstyp väljer du en typ.

    Visualiseringsredigerare

  2. Välj de data som ska visas i visualiseringen. Vilka fält som är tillgängliga beror på den valda typen.

  3. Klicka på Spara.

Skapa en ny dataprofil

Kommentar

Finns i Databricks Runtime 9.1 LTS och senare.

Dataprofiler visar sammanfattningsstatistik för en Apache Spark DataFrame, en Pandas DataFrame eller en SQL-tabell i tabell- och grafiskt format. Om du vill skapa en dataprofil från en resultatcell klickar du på + och väljer dataprofil.

Azure Databricks beräknar och visar sammanfattningsstatistiken.

Dataprofil

  • Numeriska och kategoriska funktioner visas i separata tabeller.
  • Längst upp på fliken kan du sortera eller söka efter funktioner.
  • Överst i diagramkolumnen kan du välja att visa ett histogram (Standard) eller quantiles.
  • Kontrollera expandera för att förstora diagrammen.
  • Kontrollera loggen för att visa diagrammen i en loggskala.
  • Du kan hovra markören över diagrammen för mer detaljerad information, till exempel gränserna för en histogramkolumn och antalet rader i den eller kvantilvärdet.

Du kan också generera dataprofiler programmatiskt. se kommandot summarize (dbutils.data.summarize).

Arbeta med visualiseringar och dataprofiler

Kommentar

Dataprofiler är tillgängliga i Databricks Runtime 9.1 LTS och senare.

Byta namn på, duplicera eller ta bort en visualisering eller dataprofil

Om du vill byta namn på, duplicera eller ta bort en visualisering eller dataprofil klickar du på den nedåtriktade pilen till höger om tabbnamnet. Du kan också skapa en instrumentpanel från menyn.

Kommentar

Om cellen innehåller en dataprofil kan den associerade visualiseringen och dataprofilen endast läggas till i en instrumentpanel i en notebook. För celler med endast visualiseringar visas ytterligare ett Lägg till på instrumentpanelen menyalternativet i rullgardinsmenyn. Se Lägg till en visualisering på en instrumentpanel.

Notebook-dataprofilens nedrullningsbara meny

Du kan också ändra namnet genom att klicka direkt på det och redigera namnet på plats.

Redigera en visualisering

Klicka Knappen Redigera visualisering under visualiseringen för att öppna visualiseringsredigeraren. När du har gjort ändringarna klickar du på Spara.

Redigera färger

Du kan anpassa en visualiserings färger när du skapar visualiseringen eller genom att redigera den.

  1. Skapa eller redigera en visualisering.
  2. Klicka på Färger.
  3. Om du vill ändra en färg klickar du på fyrkanten och väljer den nya färgen genom att göra något av följande:
    • Klicka på den i färgväljaren.
    • Ange ett hexvärde.
  4. Klicka någonstans utanför färgväljaren för att stänga den.
  5. Klicka på Spara i Visualiseringsredigeraren för att spara ändringarna.

Val av serie

Om du vill välja en specifik serie att analysera i ett diagram använder du följande kommandon:

  • Klicka på ett enda förklaringsobjekt för att välja serien
  • Cmd/Ctrl + klicka på ett förklaringsobjekt för att välja eller avmarkera flera serier

Serieval

Sorterade knappbeskrivningar

Använd verktygstips på linjediagram och ostackade stapeldiagram, ordnade efter storlek, för enklare analys.

sorterade verktygstips

Zooma

För datatäta diagram kan det vara bra att zooma in på enskilda datapunkter för att undersöka detaljer och beskära extremvärden. Om du vill zooma in ett diagram klickar du och drar på arbetsytan. Om du vill rensa zoomningen hovra över arbetsytan och klicka på knappen Rensa zoom i det övre högra hörnet av visualiseringen.

zooma in för att se information

Ladda ned en visualisering som en PNG-fil

Om du vill läsa in en visualisering som en PNG-fil hovra över arbetsytan och klicka på nedladdningsikonen i det övre högra hörnet.

Klicka på ladda ned för att exportera visualiseringen som en PNG-fil

En png-fil laddas ned till enheten.

Lägga till en visualisering på en instrumentpanel

  1. Klicka på den nedåtriktade pilen till höger om tabbnamnet.
  2. Välj Lägg till på instrumentpanelen. En lista över tillgängliga instrumentpanelsvyer visas, tillsammans med ett menyalternativ Lägg till i ny instrumentpanel.
  3. Välj en instrumentpanel eller välj Lägg till i ny instrumentpanel. Instrumentpanelen visas, inklusive den nyligen tillagda visualiseringen.

Äldre visualiseringar

Den senaste versionen av diagramvisualiseringar är aktiverad som standard. Inställningarna i det här avsnittet beskriver äldre visualisering som du kan stöta på när du arbetar med ett äldre diagram, eller om du har den senaste versionen inaktiverad.

Visualiseringsverktyg

Om du svävar över det övre högra hörnet av ett diagram, visas Plotly-verktygsfältet där du kan utföra åtgärder som att välja, zooma och panorera.

Verktygsfältet för visualiseringsredigeraren för notebook-filer

Ladda ned en visualisering

Om du vill ladda ned en visualisering i .png format klickar du på kameraikonen kameraikoni notebook-cellen eller i visualiseringsredigeraren.

  • I en resultatcell visas kameraikonen längst upp till höger när du flyttar markören över cellen.

    kamera i notebook-cell

  • I visualiseringsredigeraren visas kameraikonen när du flyttar markören över diagrammet. Se Visualiseringsverktyg.

Dölj eller visa en serie tillfälligt

Om du vill dölja en serie i en visualisering klickar du på serien i förklaringen. Om du vill visa serien igen klickar du på den igen i förklaringen.

Om du bara vill visa en enda serie dubbelklickar du på serien i förklaringen. Om du vill visa andra serier klickar du på var och en.