Visualisations dans les notebooks Databricks
Azure Databricks offre une prise en charge intégrée des graphiques et des visualisations dans Databricks SQL et dans les notebooks. Cette page explique comment utiliser des visualisations dans un notebook Databricks. Pour plus d’informations sur l’utilisation des visualisations dans Databricks SQL, consultez Visualisation dans Databricks SQL.
Pour afficher les types de visualisations, consultez Types de visualisation.
Créer une visualisation
Pour recréer l’exemple de cette section, utilisez le code suivant :
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Pour créer une visualisation, cliquez sur + au-dessus d’un résultat et sélectionnez Visualisation. L’éditeur de visualisation s’affiche.
Dans la liste déroulante Type de visualisation, choisissez un type.
Sélectionnez les données à afficher dans la visualisation. Les champs disponibles dépendent du type sélectionné.
Cliquez sur Enregistrer.
Créer un profil de données
Remarque
Disponible dans Databricks Runtime 9.1 LTS et ultérieur.
Les profils de données affichent une synthèse des statistiques d’un DataFrame Apache Spark, d’un DataFrame pandas ou d’une table SQL au format tabulaire et graphique. Pour créer un profil de données à partir d’une cellule de résultats, cliquez sur + et sélectionnez Profil de données.
Azure Databricks calcule et affiche la synthèse des statistiques.
- Les fonctionnalités numériques et de catégorie sont indiquées dans des tables distinctes.
- En haut de l’onglet, vous pouvez trier ou rechercher des fonctionnalités.
- En haut de la colonne de graphique, vous pouvez choisir d’afficher un histogramme (standard) ou des quantiles.
- Cochez développer pour agrandir les graphiques.
- Cochez log pour afficher les graphiques sur une échelle logarithmique.
- Vous pouvez pointer votre curseur sur les graphiques pour obtenir des informations plus détaillées, telles que les limites d’une colonne d’histogramme et le nombre de lignes qu’elle contient, ou la valeur de quantile.
Vous pouvez également générer des profils de données par programmation. Consultez la commande summarize (dbutils.data.summarize).
Utiliser des visualisations et des profils de données
Remarque
Les profils de données sont disponibles dans Databricks Runtime 9.1 LTS et versions ultérieures.
Renommer, dupliquer ou supprimer une visualisation ou un profil de données
Pour renommer, dupliquer ou supprimer une visualisation ou un profil de données, cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet. Vous pouvez également créer un tableau de bord à partir du menu.
Remarque
Si la cellule contient un profil de données, la visualisation associée et le profil de données ne peuvent être ajoutés qu’à un tableau de bord de notebook. Pour les cellules avec uniquement des visualisations, vous verrez un élément de menu supplémentaire Ajouter au tableau de bord dans le menu déroulant. Consultez Ajouter une visualisation à un tableau de bord.
menu déroulant
Vous pouvez également modifier le nom en cliquant directement dessus et en modifiant le nom en place.
Modifier une visualisation
Cliquez sur sous la visualisation pour ouvrir l’éditeur de visualisation. Lorsque vous avez terminé vos modifications, cliquez sur Enregistrer.
Modifier les couleurs
Vous pouvez personnaliser les couleurs d’une visualisation quand vous créez la visualisation ou en la modifiant.
- Créez ou modifiez une visualisation.
- Cliquez sur Couleurs.
- Pour modifier une couleur, cliquez sur le carré et sélectionnez la nouvelle couleur en procédant de l’une des façons suivantes :
- Cliquez dessus dans le sélecteur de couleurs.
- Entrez une valeur hexadécimale.
- Cliquez n’importe où en dehors du sélecteur de couleur pour le fermer.
- Cliquez sur Enregistrer dans l’éditeur de visualisation pour enregistrer les modifications.
Sélection des séries
Pour sélectionner une série spécifique à analyser sur un graphique, utilisez les commandes suivantes :
- Cliquez sur un seul élément de légende pour sélectionner cette série
- Cmd/Ctrl + cliquez sur un élément de légende pour sélectionner ou désélectionner plusieurs séries
Info-bulles triées
Utilisez les info-bulles sur les graphiques en courbes et les graphiques à barres non empilées, classées par taille pour faciliter l’analyse.
Zoom
Pour les graphiques denses de données, le zoom avant sur des points de données individuels peut être utile pour examiner les détails et rogner les valeurs hors norme. Pour effectuer un zoom avant dans un graphique, cliquez et faites glisser sur la zone de dessin. Pour effacer le zoom, pointez sur le canevas et cliquez sur le bouton Effacer le zoom dans le coin supérieur droit de la visualisation.
Télécharger une visualisation en tant que fichier PNG
Pour télécharger une visualisation en tant que fichier PNG, pointez sur le canevas et cliquez sur l’icône de téléchargement dans le coin supérieur droit.
Un fichier png est téléchargé sur votre appareil.
Ajouter une visualisation à un tableau de bord
- Cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet.
- Sélectionnez Ajouter au tableau de bord. Une liste des affichages de tableau de bord disponibles s’affiche, ainsi qu’une option de menu Ajouter au nouveau tableau de bord.
- Sélectionnez un tableau de bord ou sélectionnez Ajouter au nouveau tableau de bord. Le tableau de bord s’affiche, y compris la visualisation nouvellement ajoutée.
Visualisations héritées
La dernière version des visualisations de graphique est activée par défaut. Les paramètres de cette section décrivent la visualisation héritée que vous pouvez rencontrer lors de l’utilisation d’un graphique plus ancien ou si la dernière version est désactivée.
Outils de visualisation
Si vous passez la souris sur le coin supérieur droit d'un graphique, une barre d'outils Plotly apparaît où vous pouvez effectuer des opérations telles que sélectionner, zoomer et déplacer.
Télécharger une visualisation
Pour télécharger une visualisation au format .png, cliquez sur l’icône d’appareil-photo dans la cellule du notebook ou dans l’éditeur de visualisation.
Dans une cellule de résultat, l’icône d’appareil photo apparaît en haut à droite lorsque vous déplacez le curseur sur la cellule.
Dans l’éditeur de visualisation, l’icône d’appareil-photo s’affiche lorsque vous déplacez le curseur sur le graphique. Consultez Outils de visualisation.
Masquer ou afficher temporairement une série
Pour masquer une série dans une visualisation, cliquez sur la série dans la légende. Pour afficher à nouveau la série, recliquez dans la légende.
Pour afficher une seule série, double-cliquez sur la série dans la légende. Pour afficher d’autres séries, cliquez sur chacune d’elles.