Visualisierungen in Databricks-Notebooks
Azure Databricks bietet integrierte Unterstützung für Diagramme und Visualisierungen sowohl in Databricks SQL als auch in Notebooks. Auf dieser Seite wird beschrieben, wie Sie mit Visualisierungen in einem Databricks-Notebook arbeiten. Informationen zur Verwendung von Visualisierungen in Databricks SQL finden Sie unter Visualisierungen in Databricks SQL.
Informationen zum Anzeigen der Visualisierungstypen finden Sie unter Visualisierungstypen.
Erstellen einer neuen Visualisierung
Verwenden Sie den folgenden Code, um das Beispiel in diesem Abschnitt nachzustellen:
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Klicken Sie zum Erstellen einer Visualisierung über einem Ergebnis auf + und wählen Sie Visualisierung aus. Der Visualisierungs-Editor wird angezeigt.
Wählen Sie in der Dropdownliste Visualisierungstyp einen Typ aus.
Wählen Sie die Daten aus, die in der Visualisierung angezeigt werden sollen. Die verfügbaren Felder hängen vom ausgewählten Typ ab.
Klicken Sie auf Speichern.
Erstellen eines neuen Datenprofils
Hinweis
Verfügbar in Databricks Runtime 9.1 LTS und höheren Versionen.
Datenprofile zeigen Zusammenfassungsstatistiken eines Apache Spark-DataFrame, eines Pandas-DataFrame oder einer SQL-Tabelle im Tabellen- und Grafikformat an. Um ein Datenprofil aus einer Ergebniszelle zu erstellen, klicken Sie auf + und wählen Sie Datenprofil.
Azure Databricks berechnet und zeigt die Zusammenfassungsstatistiken an.
- Numerische und kategorische Features werden in separaten Tabellen angezeigt.
- Oben auf der Registerkarte können Sie nach Features sortieren oder suchen.
- Oben in der Diagrammspalte können Sie ein Histogramm (Standard) oder Quantile anzeigen.
- Aktivieren Sie das Kontrollkästchen Erweitern, um die Diagramme zu vergrößern.
- Aktivieren Sie das Kontrollkästchen Protokoll, um die Diagramme auf einer Protokollskala anzuzeigen.
- Sie können den Cursor über die Diagramme bewegen, um ausführlichere Informationen zu erhalten, z. B. die Grenzen einer Histogrammspalte und die Anzahl der darin enthaltenen Zeilen oder den Quantilwert.
Sie können Datenprofile auch programmgesteuert generieren. Informationen dazu finden Sie unter dem summarize-Befehl (dbutils.data.summarize).
Arbeiten mit Visualisierungen und Datenprofilen
Hinweis
Datenprofile sind in Databricks Runtime 9.1 LTS und höher verfügbar.
Umbenennen, Duplizieren oder Entfernen einer Visualisierung oder eines Datenprofils
Um eine Visualisierung oder ein Datenprofil umzubenennen, zu duplizieren oder zu entfernen, klicken Sie auf den nach unten zeigenden Pfeil rechts neben dem Namen der Registerkarte. Sie können auch ein Dashboard über das Menü erstellen.
Hinweis
Wenn die Zelle ein Datenprofil enthält, können die zugeordnete Visualisierung und das Datenprofil nur einem Notizbuchdashboard hinzugefügt werden. Für Zellen mit nur Visualisierungen wird in der Dropdownliste zusätzlich das Menüelement Zum Dashboard hinzufügen angezeigt. Siehe Hinzufügen einer Visualisierung zu einem Dashboard.
Sie können den Namen auch ändern, indem Sie direkt darauf klicken und den Namen bearbeiten.
Bearbeiten einer Visualisierung
Klicken Sie unter der Visualisierung auf , um den Visualisierungs-Editor zu öffnen. Wenn Sie die Änderungen vorgenommen haben, klicken Sie auf Speichern.
Bearbeiten von Farben
Sie können die Farben einer Visualisierung anpassen, wenn Sie die Visualisierung erstellen oder bearbeiten.
- Erstellen oder bearbeiten Sie eine Visualisierung.
- Klicken Sie auf Farben.
- Klicken Sie zum Ändern einer Farbe auf das Quadrat, und wählen Sie die neue Farbe aus, indem Sie eine der folgenden Aktionen ausführen:
- Klicken Sie in der Farbauswahl auf die gewünschte Farbe.
- Geben Sie einen Hexadezimalwert ein.
- Klicken Sie auf eine beliebige Stelle außerhalb der Farbauswahl, um sie zu schließen.
- Klicken Sie im Visualisierungseditor auf Speichern, um die Änderungen zu speichern.
Serieauswahl
Verwenden Sie die folgenden Befehle, um eine bestimmte Datenreihe auszuwählen, die in einem Diagramm analysiert werden soll:
- Klicken Sie auf ein einzelnes Legendenelement, um diese Datenreihe auszuwählen.
- Cmd/STRG+ Klicken Sie auf ein Legendenelement, um mehrere Datenreihen auszuwählen oder zu deaktivieren.
Sortierte QuickInfos
Verwenden Sie Tooltips für Liniendiagramme und nicht gestapelte Balkendiagramme, nach Größe sortiert, um die Analyse zu vereinfachen.
Zoom
Bei datendichten Diagrammen kann das Vergrößern einzelner Datenpunkte hilfreich sein, um Details zu untersuchen und Ausreißer zuzuschneiden. Um ein Diagramm zu vergrößern, klicken Sie in den Bereich, und führen Sie eine ziehende Bewegung aus. Um den Zoom zu löschen, zeigen Sie auf die Canvas, und klicken Sie in der oberen rechten Ecke der Visualisierung auf die Schaltfläche Zoom löschen.
anzuzeigen
Herunterladen einer Visualisierung als PNG-Datei
Um eine Visualisierung als PNG-Datei zu laden, zeigen Sie mit der Maus auf die Canvas, und klicken Sie in der oberen rechten Ecke auf das Downloadsymbol.
Eine PNG-Datei wird auf Ihr Gerät heruntergeladen.
Hinzufügen einer Visualisierung zu einem Dashboard
- Klicken Sie auf den nach unten zeigenden Pfeil rechts neben dem Namen der Registerkarte.
- Wählen Sie Zum Dashboard hinzufügen aus. Eine Liste der verfügbaren Dashboardansichten wird zusammen mit der Menüoption Add to new dashboard (Zum neuen Dashboard hinzufügen) angezeigt.
- Wählen Sie ein Dashboard oder Add to new dashboard aus. Das Dashboard wird angezeigt, einschließlich der neu hinzugefügten Visualisierung.
Legacy-Visualisierungen
Die neueste Version von Diagrammvisualisierungen ist standardmäßig aktiviert. Die Einstellungen in diesem Abschnitt beschreiben veraltete Visualisierung, die beim Arbeiten mit einem älteren Diagramm auftreten kann, oder wenn die neueste Version deaktiviert ist.
Visualisierungstools
Wenn Sie über die obere rechte Ecke eines Diagramms zeigen, wird eine Plotly-Symbolleiste angezeigt, in der Sie Vorgänge wie Auswählen, Zoomen und Schwenken ausführen können.
Herunterladen einer Visualisierung
Klicken Sie auf das Kamerasymbol in der Notebookzelle oder dem Visualisierungs-Editor, um eine Visualisierung im PNG-Format herunterzuladen.
In einer Ergebniszelle erscheint das Kamerasymbol oben rechts, wenn Sie den Cursor über die Zelle bewegen.
Im Visualisierungs-Editor wird das Kamerasymbol angezeigt, wenn Sie mit dem Mauszeiger auf das Diagramm zeigen. Weitere Informationen finden Sie unter Visualisierungstools.
Vorübergehendes Ausblenden oder Anzeigen einer Serie
Um eine Reihe in einer Visualisierung auszublenden, klicken Sie in der Legende auf die Reihe. Wenn Sie die Reihe erneut anzeigen möchten, klicken Sie in der Legende erneut darauf.
Um nur eine einzelne Reihe anzuzeigen, doppelklicken Sie in der Legende auf die Reihe. Wenn Sie andere Reihen anzeigen möchten, klicken Sie auf jede Reihe.