Partager via


Surveillance et observabilité des projets Databricks

Cet article décrit les fonctionnalités disponibles dans l’interface utilisateur Azure Databricks pour afficher les tâches auxquelles vous avez accès, afficher l’historique des exécutions d’une tâche et afficher les détails des exécutions de tâches. Pour configurer des notifications pour les projets, consultez Ajouter un e-mail et des notifications système pour les événements de projet.

Pour en savoir plus sur l’utilisation de l’interface CLI Databricks pour afficher et exécuter des tâches, exécutez les commandes CLI databricks jobs list -h, databricks jobs get -h et databricks jobs run-now -h. Pour en savoir plus sur l’utilisation de l’API Travaux, consultez API Travaux.

Si vous avez accès au schéma system.lakeflow, vous pouvez également afficher et interroger les enregistrements des exécutions de travaux et des tâches à partir de votre compte. Consultez Référence de la table du système des travaux.

Voir les emplois

Pour afficher la liste des tâches auquel vous avez accès, cliquez sur Icône de flux de travail Workflows dans la barre latérale. L'onglet Tâches de l'interface utilisateur des workflows répertorie les informations sur toutes les tâches disponibles, telles que le créateur de la tâche, le déclencheur de la tâche, le cas échéant, et le résultat de la dernière exécution.

Pour modifier les colonnes affichées dans la liste des tâches, cliquez sur l'icône Paramètres et sélectionnez ou désélectionnez les colonnes.

Vous pouvez filtrer les travaux dans la liste des travaux :

  • Utilisation de mots clés. Si la fonctionnalité d’augmentation de la limite des travaux est activée pour cet espace de travail, la recherche par mots clés est prise en charge uniquement pour les champs nom, ID de travail et étiquette de travail.
  • Sélection des travaux que vous possédez uniquement.
  • Sélection de tous les travaux auxquels vous êtes autorisé à accéder.
  • Utilisation d’étiquettes. Pour rechercher une étiquette créée uniquement avec une clé, tapez la clé dans la zone de recherche. Pour rechercher une étiquette créée avec une clé et une valeur, vous pouvez lancer une recherche par clé, valeur ou clé et valeur. Par exemple, pour une étiquette avec la clé department et la valeur finance, vous pouvez rechercher department ou finance pour trouver les travaux correspondants. Pour effectuer une recherche par clé et valeur, entrez la clé et la valeur séparées par deux points ; Par exemple, department:finance.

Vous pouvez également cliquer sur n’importe quel en-tête de colonne pour trier la liste des travaux (décroissant ou croissant) par cette colonne. Lorsque la fonctionnalité de l’augmentation de la limite des travaux est activée, vous pouvez trier uniquement par Name, Job ID ou Created by. Le tri par défaut est par Name dans l’ordre croissant.

Cliquez sur menu Kebab des tâches pour accéder aux actions liées à la tâche, par exemple supprimer la tâche.

Afficher les exécutions d’un travail

Vous pouvez afficher la liste des exécutions en cours et de celles qui se sont récemment terminées pour tous les travaux auxquels vous avez accès, y compris les exécutions démarrées par des outils d’orchestration externes comme Apache Airflow ou Azure Data Factory. Pour afficher la liste des exécutions de travaux récentes :

  1. Cliquez sur Icône de flux de travail Workflows dans la barre latérale.
  2. Dans la colonne Nom, cliquez sur le nom d’un travail. L'onglet Exécutions apparaît avec des vues matricielles et de liste des exécutions actives et terminées.

La vue matricielle montre un historique des exécutions pour le travail, avec chaque tâche du travail.

La ligne Durée totale de l’exécution de la matrice affiche la durée totale de l’exécution et l’état de l’exécution. Pour voir les détails de l’exécution, y compris l’heure de début, la durée et l’état, pointez sur la barre dans la ligne Durée totale de l’exécution.

Chaque cellule de la ligne Tâches représente une tâche et l’état correspondant de la tâche. Pour voir les détails de chaque tâche, y compris l’heure de début, la durée, le cluster et l’état, pointez sur la cellule pour cette tâche.

Les barres d’exécution du travail et d’exécution des tâches ont des codes couleur pour indiquer l’état de l’exécution. Les exécutions réussies sont en vert, les exécutions ayant échoué sont en rouge et les exécutions ignorées sont en rose. La hauteur des barres d'exécution de tâches individuelles et d'exécution de tâches indique visuellement la durée de l'exécution.

Si vous avez configuré une heure d'achèvement prévue, la vue matricielle affiche un avertissement lorsque la durée d'une exécution dépasse la durée configurée.

Par défaut, la vue de la liste des exécutions affiche :

  • L’heure de début de l’exécution.
  • L’identificateur de l'exécution.
  • Si l’exécution a été déclenchée par une planification de travail ou par une demande d’API, ou si elle a été démarrée manuellement.
  • Temps écoulé pour une tâche en cours d'exécution ou durée totale d'exécution pour une exécution terminée. Un avertissement s'affiche si la durée dépasse une heure d'achèvement prévue configurée.
  • Liens vers les journaux Spark.
  • L’état de l’exécution : Queued, Pending, Running, Skipped, Succeeded, Failed, Terminating, Terminated, Internal Error, Timed Out, Canceled, Canceling ou Waiting for Retry.
  • Cliquez sur menu Kebab des tâches pour accéder aux actions spécifiques au contexte de l'exécution, par exemple arrêter une exécution active ou supprimer une exécution terminée.

Pour modifier les colonnes affichées dans la vue de la liste des exécutions, cliquez sur l'icône Paramètres et sélectionnez ou désélectionnez les colonnes.

Pour voir les détails d’une exécution de travail, cliquez sur le lien de l’exécution dans la colonne Heure de début dans l’affichage de liste d’exécutions. Pour afficher les détails de l'exécution réussie la plus récente de cette tâche, cliquez sur Accéder à la dernière exécution réussie.

Azure Databricks conserve un historique de vos exécutions de travaux jusqu’à 60 jours. Si vous devez conserver les exécutions de tâches, Databricks recommande d'exporter les résultats avant leur expiration. Pour plus d’informations, consultez Exporter les résultats de l’exécution d’un travail.

Afficher les détails de l’exécution d’un travail

La page de détails de l’exécution du travail contient la sortie du travail et des liens vers des journaux, y compris des informations sur la réussite ou l’échec de chaque tâche dans l’exécution du travail. Vous pouvez accéder aux détails de l’exécution d’un travail à partir de l’onglet Exécutions du travail. Pour voir les détails d’une exécution de travail à partir de l’onglet Exécutions, cliquez sur le lien de l’exécution dans la colonne Heure de début dans l’affichage de liste d’exécutions. Pour revenir à l’onglet Exécutions du travail, cliquez sur la valeur ID du travail.

Si le travail contient plusieurs tâches, cliquez sur une tâche pour afficher ses détails d’exécution, notamment :

  • le cluster qui a exécuté la tâche ;
    • l’interface utilisateur Spark pour la tâche ;
    • les journaux de la tâche ;
    • les métriques de la tâche.

Cliquez sur la valeur ID du travail pour revenir à l’onglet Exécutions.

Comment Azure Databricks détermine-t-il l’état d’exécution des projets ?

Azure Databricks détermine si l’exécution d’un projet a réussi en fonction du résultat des tâches du nœud terminal du projet. Une tâche du nœud terminal est une tâche qui n’a aucune dépendance en aval. Une exécution de travail peut aboutir à l’un des trois résultats suivants :

  • Réussite : toutes les tâches ont réussi.
  • Réussite avec échecs : certaines tâches ont échoué, mais toutes les tâches du nœud terminal ont réussi.
  • Échec : une ou plusieurs tâches du nœud terminal ont échoué.

Afficher l’historique des exécutions des tâches

Pour visualiser l’historique des exécutions d’une tâche, y compris les exécutions réussies et en échec :

  1. Cliquez sur une tâche dans la page Détails de l’exécution du travail. La page Détails d’exécution des tâches apparaît.
  2. Sélectionnez l’exécution de tâche dans la liste déroulante de l’historique des exécutions.

Afficher l’historique des exécutions de tâche pour une tâche For each

L’accès à l’historique des exécutions d’une tâche For each est identique à une tâche de travaux Azure Databricks standard. Vous pouvez cliquer sur le nœud de tâche For each sur la page Détails d’exécution des travaux ou sur la cellule correspondante dans la vue matrice. Toutefois, contrairement à une tâche standard, les détails d’exécution d’une tâche For each sont présentés sous la forme d’un tableau des itérations de la tâche imbriquée.

Pour afficher uniquement les itérations ayant échoué, cliquez sur Itérations ayant échoué uniquement.

Pour afficher la sortie d’une itération, cliquez sur les valeurs Heure de début ou Heure de fin de l’itération.

Afficher les exécutions de travaux récentes

Vous pouvez afficher la liste des exécutions en cours et de celles qui se sont récemment terminées pour tous les travaux d’un espace de travail auquel vous avez accès, y compris les exécutions démarrées par des outils d’orchestration externes comme Apache Airflow ou Azure Data Factory. Pour afficher la liste des exécutions de travaux récentes :

  1. Cliquez sur Icône de flux de travail Workflows dans la barre latérale.
  2. Cliquez sur l’onglet Exécutions des travaux pour afficher la liste des exécutions de travaux.

Le graphique du nombre d'exécutions terminées affiche le nombre d'exécutions de tâches terminées au cours des dernières 48 heures. Par défaut, le graphique affiche les exécutions de tâches ayant échoué, ignorées et réussies. Vous pouvez également filtrer le graphique pour afficher des statuts d'exécution spécifiques ou restreindre le graphique à une plage de temps spécifique. L'onglet Exécutions de tâches comprend également un tableau des exécutions de tâches des 67 derniers jours. Par défaut, le tableau inclut des détails sur les exécutions de tâches ayant échoué, ignorées et réussies.

Remarque

Le graphique du nombre d’exécutions terminées s’affiche uniquement lorsque vous cliquez sur Propriété de moi.

Vous pouvez filtrer le nombre d'exécutions terminées par statut d'exécution :

  • Pour mettre à jour le graphique afin d'afficher les tâches en cours d'exécution ou en attente d'exécution, cliquez sur Exécutions actives.
  • Pour mettre à jour le graphique afin d'afficher uniquement les exécutions terminées, y compris les exécutions ayant échoué, réussies et ignorées, cliquez sur Exécutions terminées.
  • Pour mettre à jour le graphique afin d'afficher uniquement les exécutions terminées avec succès au cours des dernières 48 heures, cliquez sur Exécutions réussies.
  • Pour mettre à jour le graphique afin d'afficher uniquement les exécutions ignorées, cliquez sur Exécutions ignorées. Les exécutions sont ignorées car vous avez dépassé le nombre maximum d'exécutions simultanées dans votre espace de travail ou parce que la tâche a dépassé le nombre maximum d'exécutions simultanées spécifié par la configuration de la tâche.
  • Pour mettre à jour le graphique afin d'afficher uniquement les exécutions terminées dans un état d'erreur, cliquez sur Exécutions ayant échoué.

Lorsque vous cliquez sur l'un des boutons de filtre, la liste des exécutions dans le tableau des exécutions est également mise à jour pour afficher uniquement les exécutions de tâches correspondant au statut sélectionné.

Pour limiter la plage de temps affichée dans le graphique du nombre d'exécutions terminées, cliquez et faites glisser votre curseur dans le graphique pour sélectionner la plage de temps. Le graphique et le tableau des exécutions sont mis à jour pour afficher les exécutions uniquement à partir de la plage de temps sélectionnée.

Par défaut, la liste des exécutions dans le tableau des exécutions affiche :

  • L’heure de début de l’exécution.
  • Le nom du travail associé à l’exécution.
  • Le nom d’utilisateur sous lequel le travail s’exécute.
  • Si l’exécution a été déclenchée par une planification de travail ou par une demande d’API, ou si elle a été démarrée manuellement.
  • Temps écoulé pour une tâche en cours d'exécution ou durée totale d'exécution pour une exécution terminée. Un avertissement s'affiche si la durée dépasse une heure d'achèvement prévue configurée.
  • L’état de l’exécution : Queued, Pending, Running, Skipped, Succeeded, Failed, Terminating, Terminated, Internal Error, Timed Out, Canceled, Canceling ou Waiting for Retry.
  • Tous les paramètres de l’exécution.
  • Cliquez sur menu Kebab des tâches pour accéder aux actions spécifiques au contexte de l'exécution, par exemple arrêter une exécution active ou supprimer une exécution terminée.

Pour modifier les colonnes affichées dans la liste des analyses, cliquez sur l'icône Paramètres et sélectionnez ou désélectionnez les colonnes.

Le tableau des 5 principaux types d'erreurs affiche une liste des types d'erreurs les plus fréquents pour la plage de temps sélectionnée, vous permettant de voir rapidement les causes les plus courantes des problèmes de tâches dans votre espace de travail.

Pour voir les détails de l’exécution du travail, cliquez sur le lien dans la colonne Heure de début pour l’exécution. Pour voir les détails du travail, cliquez sur le nom du travail dans la colonne Travail.

Afficher les informations de traçabilité d’un travail

Si Unity Catalog est activé dans votre espace de travail, vous pouvez afficher les informations de traçabilité pour toutes les tables Unity Catalog de votre workflow. Si des informations de traçabilité sont disponibles pour votre workflow, vous voyez un lien avec un nombre de tables en amont et en aval dans le panneau Détails du travail pour votre travail, dans le volet Détails de l’exécution du travail pour une exécution de travail ou dans le panneau Détails de l’exécution de la tâche pour une exécution de tâche. Cliquez sur le lien pour afficher la liste des tables. Cliquez sur une table pour afficher des informations détaillées dans Catalog Explorer.

Afficher et exécuter une tâche créée à l’aide d’un pack de ressources Databricks

Vous pouvez utiliser l’interface utilisateur des travaux Azure Databricks pour afficher et exécuter des travaux déployés par un Pack de ressources Databricks. Par défaut, ces travaux sont en lecture seule dans l’interface utilisateur des travaux. Pour modifier un travail déployé par un pack, modifiez le fichier de configuration du pack et redéployez le travail. Appliquer des modifications uniquement à la configuration du bundle garantit que les fichiers sources du pack capturent toujours la configuration actuelle du travail.

Toutefois, si vous devez apporter des modifications immédiates à un travail, vous pouvez déconnecter le travail de la configuration du pack pour activer la modification des paramètres de travail dans l’interface utilisateur. Pour déconnecter le travail, cliquez sur Déconnecter de la source. Dans la boîte de dialogue Déconnecter de la source, cliquez sur Déconnecter pour confirmer.

Les modifications que vous apportez au travail dans l’interface utilisateur ne sont pas appliquées à la configuration du pack. Pour appliquer les modifications que vous apportez au pack dans l’interface utilisateur, vous devez mettre à jour manuellement la configuration du pack. Pour reconnecter le travail à la configuration du pack, redéployez le travail à l’aide du pack.

Exporter les résultats de l'exécution du travail

Vous pouvez exporter les résultats de l’exécution d’un notebook et les journaux d’exécution d’un travail pour tous les types de travaux.

Exporter les résultats de l’exécution d’un notebook

Vous pouvez conserver les exécutions d’un travail en exportant leurs résultats. Pour les exécutions de travaux d’un notebook, vous pouvez exporter un notebook rendu pouvant être importé ultérieurement dans votre espace de travail Azure Databricks.

Pour exporter les résultats de l’exécution du notebook pour un travail avec une seule tâche :

  1. Sur la page des détails du travail, cliquez sur le lien Afficher les détails de l’exécution dans la colonne Exécuter de la table Completed Runs (past 60 days) [Exécutions terminées (60 derniers jours)].
  2. Cliquez sur Exporter au format CSV.

Pour exporter les résultats de l’exécution du notebook pour un travail avec plusieurs tâches :

  1. Sur la page des détails du travail, cliquez sur le lien Afficher les détails de l’exécution dans la colonne Exécuter de la table Completed Runs (past 60 days) [Exécutions terminées (60 derniers jours)].
  2. Cliquez sur la tâche du notebook à exporter.
  3. Cliquez sur Exporter au format CSV.

Exporter les journaux de l’exécution d’un travail

Vous pouvez également exporter les journaux de l’exécution de votre travail. Vous pouvez configurer votre travail pour qu’il remette automatiquement les journaux à DBFS via l’API Travaux. Consultez l'objet new_cluster.cluster_log_conf dans le corps de la demande passé à l’opération Create a new job (Créer un travail) (POST /jobs/create) dans l’API Travaux.