Visualisaties in Databricks-notebooks
Azure Databricks biedt ingebouwde ondersteuning voor grafieken en visualisaties in zowel Databricks SQL als in notebooks. Op deze pagina wordt beschreven hoe u met visualisaties in een Databricks-notebook kunt werken. Zie Visualisatie in Databricks SQL voor informatie over het gebruik van visualisaties in Databricks SQL.
Zie visualisatietypen om de typen visualisaties weer te geven.
Een nieuwe visualisatie maken
Gebruik de volgende code om het voorbeeld in deze sectie opnieuw te maken:
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Als u een visualisatie wilt maken, klikt u op + boven een resultaat en selecteert u Visualisatie. De visualisatie-editor wordt weergegeven.
Kies een type in de vervolgkeuzelijst Visualisatietype .
Selecteer de gegevens die in de visualisatie moeten worden weergegeven. De beschikbare velden zijn afhankelijk van het geselecteerde type.
Klik op Opslaan.
Een nieuw gegevensprofiel maken
Notitie
Beschikbaar in Databricks Runtime 9.1 LTS en hoger.
Gegevensprofielen geven samenvattingsstatistieken weer van een Apache Spark DataFrame, een Pandas DataFrame of een SQL-tabel in tabelvorm en grafische indeling. Als u een gegevensprofiel wilt maken vanuit een resultatencel, klikt u op + en selecteert u Gegevensprofiel.
Azure Databricks berekent en geeft de overzichtsstatistieken weer.
- Numerieke en categorische functies worden weergegeven in afzonderlijke tabellen.
- Boven aan het tabblad kunt u functies sorteren of zoeken.
- Boven aan de grafiekkolom kunt u ervoor kiezen om een histogram (Standard) of kwantielen weer te geven.
- Schakel het selectievakje uit om de grafieken te vergroten.
- Controleer het logboek om de grafieken weer te geven op een logboekschaal.
- U kunt de cursor over de grafieken bewegen voor meer gedetailleerde informatie, zoals de grenzen van een histogramkolom en het aantal rijen erin of de kwantielwaarde.
U kunt ook programmatisch gegevensprofielen genereren; zie opdracht samenvatten (dbutils.data.summarize).
Werken met visualisaties en gegevensprofielen
Notitie
Gegevensprofielen zijn beschikbaar in Databricks Runtime 9.1 LTS en hoger.
De naam van een visualisatie of gegevensprofiel wijzigen, dupliceren of verwijderen
Als u de naam van een visualisatie of gegevensprofiel wilt wijzigen, dupliceren of verwijderen, klikt u op de pijl-omlaag rechts van de naam van het tabblad. U kunt ook een dashboard maken vanuit het menu.
Notitie
Als de cel een gegevensprofiel bevat, kunnen de bijbehorende visualisatie en gegevensprofiel alleen worden toegevoegd aan een notebookdashboard. Voor cellen met alleen visualisaties ziet u een extra Toevoegen aan dashboard menuoptie in het vervolgkeuzemenu. Zie Een visualisatie toevoegen aan een dashboard.
U kunt de naam ook wijzigen door er rechtstreeks op te klikken en de naam te bewerken.
Een visualisatie bewerken
Klik onder de visualisatie om de visualisatieeditor te openen. Wanneer u klaar bent met het aanbrengen van wijzigingen, klikt u op Opslaan.
Kleuren bewerken
U kunt de kleuren van een visualisatie aanpassen wanneer u de visualisatie maakt of door deze te bewerken.
- Een visualisatie maken of bewerken.
- Klik op Kleuren.
- Als u een kleur wilt wijzigen, klikt u op het vierkant en selecteert u de nieuwe kleur op een van de volgende manieren:
- Klik erop in de kleurkiezer.
- Voer een hexwaarde in.
- Klik ergens buiten de kleurkiezer om deze te sluiten.
- Klik op opslaan in de Visualisatie-editor om de wijzigingen op te slaan.
Serieselectie
Als u een specifieke reeks wilt selecteren die u wilt analyseren in een grafiek, gebruikt u de volgende opdrachten:
- Klik op één legenda-item om die reeks te selecteren
- Cmd/Ctrl + klik met de muis op een item in de legenda om meerdere reeksen te selecteren of deselecteren.
Gesorteerde tooltips
Gebruik tooltips op lijndiagrammen en niet-gestapelde staafdiagrammen, gerangschikt op grootte, voor een eenvoudigere analyse.
Zoom
Voor gegevensrijke diagrammen kan het inzoomen op afzonderlijke gegevenspunten handig zijn om details te onderzoeken en uitbijters bij te snijden. Als u wilt inzoomen op een grafiek, klikt u op het canvas en sleept u deze. Als u de zoom wilt wissen, beweegt u de muisaanwijzer over het canvas en klikt u op de knop Zoom wissen in de rechterbovenhoek van de visualisatie.
Een visualisatie downloaden als PNG-bestand
Als u een visualisatie als PNG-bestand wilt downloaden, beweegt u de muisaanwijzer over het canvas en klikt u op het downloadpictogram in de rechterbovenhoek.
Er wordt een PNG-bestand gedownload naar uw apparaat.
Een visualisatie toevoegen aan een dashboard
- Klik op de pijl-omlaag rechts van de naam van het tabblad.
- Selecteer Toevoegen aan dashboard. Er wordt een lijst met beschikbare dashboardweergaven weergegeven, samen met een menuoptie Toevoegen aan nieuw dashboard.
- Selecteer een dashboard of selecteer Toevoegen aan nieuw dashboard. Het dashboard wordt weergegeven, inclusief de zojuist toegevoegde visualisatie.
Verouderde visualisaties
De nieuwste versie van grafiekvisualisaties is standaard ingeschakeld. In de instellingen in deze sectie wordt de verouderde visualisatie beschreven die u kunt tegenkomen bij het werken met een oudere grafiek of als u de nieuwste versie hebt uitgeschakeld.
Hulpmiddelen voor visualisaties
Als u de muisaanwijzer rechtsboven in een grafiek plaatst, wordt er een werkbalk Plotly weergegeven waar u bewerkingen kunt uitvoeren, zoals selecteren, in- en uitzoomen en pannen.
Een visualisatie downloaden
Als u een visualisatie wilt downloaden in .png-indeling, klikt u op het camerapictogram in de cel van het notitieblok of in de visualisatie-editor.
In een resultaatcel wordt het camerapictogram rechtsboven weergegeven wanneer u de cursor over de cel beweegt.
In de visualisatie-editor wordt het camerapictogram weergegeven wanneer u de cursor over de grafiek beweegt. Zie Hulpmiddelen voor visualisaties.
Een reeks tijdelijk verbergen of weergeven
Als u een reeks in een visualisatie wilt verbergen, klikt u op de reeks in de legenda. Als u de reeks opnieuw wilt weergeven, klikt u er opnieuw op in de legenda.
Als u slechts één reeks wilt weergeven, dubbelklikt u op de reeks in de legenda. Als u andere reeksen wilt weergeven, klikt u op elke reeks.