Surveillance détaillée des applications Apache Spark

Article
01/30/2025

Avec Microsoft Fabric, vous pouvez utiliser Apache Spark pour exécuter des notebooks, des travaux Apache Spark et d'autres types d’applications dans votre espace de travail. Cet article explique comment superviser vos applications Apache Spark, et ainsi garder un œil sur leur état d’exécution actuel, leurs problèmes et la progression de leurs travaux.

Afficher les applications Apache Spark

Vous pouvez afficher toutes les applications Apache Spark à partir de la définition de tâche Spark, ou le menu contextuel de l’élément de notebook affiche l’option d’exécution récente ->Exécutions récentes.

Vous pouvez sélectionner le nom de l’application que vous souhaitez afficher dans la liste des applications, puis afficher les détails dans la page des détails de l’application.

Surveiller l’état des applications Apache Spark

Ouvrez la page Exécutions récentes du notebook ou de la définition de tâche Spark pour afficher l’état de l’application Apache.

Opération réussie

Mis(e) en file d’attente

Arrêté

Annulée

Échec

Tâches

Ouvrez un travail d’application Apache Spark à partir de la définition de tâche Spark, ou le menu contextuel de l’élément de notebook affiche l’option Exécution récente ->Exécutions récentes -> sélectionner un travail dans la page des exécutions récentes.

Dans la page des détails de l’analyse de l’application Apache Spark, la liste des exécutions de travaux s’affiche sous l’onglet Travaux. Vous pouvez afficher les détails de chaque travail ici, notamment l’ID du travail, la description, l’état, les étapes, les tâches, la durée, les données traitées, la lecture des données, les données écrites et l’extrait de code.

Cliquer sur l’ID du travail peut développer/réduire le travail.
Cliquez sur la description du travail. Vous pouvez accéder à la page du travail ou de l’étape dans l’interface utilisateur Spark.
Cliquez sur l’extrait de code du travail. Vous pouvez vérifier et copier le code associé à ce travail.

Ressources

Le graphique d’utilisation de l’exécuteur sous l’onglet Resources visualise l’allocation et l’utilisation des exécuteurs Spark pour l’application Spark actuelle en quasi-temps réel pendant l’exécution de Spark. Vous pouvez faire référence à : Surveiller l’utilisation des ressources des applications Apache Spark.

Panneau Résumé

Dans la page d’analyse de l’application Apache Spark, cliquez sur le bouton Propriétés pour ouvrir/réduire le panneau de résumé. Vous pouvez afficher les détails de cette application dans Détails.

État de cette application Spark.
ID de cette application Spark.
Durée totale.
Durée d’exécution de cette application Spark.
Durée mise en file d’attente pour cette application Spark.
ID Livy
Émetteur de cette application Spark.
Temps d’envoi pour cette application Spark.
Nombre d’exécuteurs.

Journaux d’activité

Sous l’onglet Journaux, vous pouvez afficher le journal complet des journaux Livy, du prélancement ou du pilote avec différentes options sélectionnées dans le volet gauche. Vous pouvez également récupérer directement les informations de journal requises en recherchant des mots clés et afficher les journaux en filtrant les états de journal. Cliquez sur Télécharger le journal pour télécharger les informations de journal dans le local.

Parfois, aucun journal n’est disponible, par exemple l’état du travail est mise en file d’attente et la création du cluster a échoué.

Les journaux dynamiques sont disponibles uniquement en cas d’échec de la soumission de l’application, et les journaux des pilotes sont également fournis.

Données

Sous l’onglet Données, vous pouvez copier la liste de données dans le presse-papiers, télécharger la liste de données et les données uniques, et vérifier les propriétés de chaque données.

Le volet gauche peut être développé ou réduit.
Le nom, le format de lecture, la taille, la source et le chemin des fichiers d’entrée et de sortie s’affichent dans cette liste.
Il est possible de télécharger les fichiers d’entrée et de sortie, de copier leur chemin d’accès et d’afficher leurs propriétés.

Instantanés d’élément

L’onglet Instantanés d’élément vous permet de parcourir et voir les éléments associés à l’application Apache Spark, notamment les notebooks, la définition de travail Spark et/ou les pipelines. La page des instantanés d’élément affiche l’instantané des valeurs de code et de paramètre au moment de l’exécution pour les notebooks. Il montre également l’instantané de tous les paramètres au moment de la soumission des définitions de travaux Spark. Si l’application Apache Spark est associée à un pipeline, la page d’élément associée présente également le pipeline et l’activité Spark correspondants.

Dans l’écran des instantanées d’élément, vous pouvez :

Parcourir les éléments associés dans l’arborescence hiérarchique.
Cliquer sur l’icône d’ellipse en regard de chaque élément afin d’afficher une liste d’autres actions que vous pouvez effectuer.
Cliquez sur l’élément instantané pour afficher son contenu.
Affichez la barre de navigation pour voir le chemin de l’élément sélectionné à la racine.

Remarque

La fonctionnalité Instantanés de notebook ne prend actuellement pas en charge les notebooks qui sont dans un état d’exécution ou dans une session Spark à haute concurrence.

Diagnostics

Le panneau de diagnostic fournit aux utilisateurs des recommandations en temps réel et une analyse des erreurs, qui sont générées par Spark Advisor via une analyse du code de l’utilisateur. Avec des modèles intégrés, Apache Spark Advisor permet aux utilisateurs d’éviter les erreurs courantes et analyse les échecs pour identifier leur cause racine.

L'étape suivante après avoir affiché les détails d'une application Apache Spark consiste à afficher la progression de la tâche Spark sous la cellule Notebook. Vous pouvez vous référer à :

Supervision et débogage contextuels des notebooks

Partager via

Surveillance détaillée des applications Apache Spark

Afficher les applications Apache Spark

Surveiller l’état des applications Apache Spark

Tâches

Ressources

Panneau Résumé

Journaux d’activité

Données

Instantanés d’élément

Diagnostics

Commentaires

Ressources supplémentaires

Partager via

Surveillance détaillée des applications Apache Spark

Afficher les applications Apache Spark

Surveiller l’état des applications Apache Spark

Tâches

Ressources

Panneau Résumé

Journaux d’activité

Données

Instantanés d’élément

Diagnostics

Contenu connexe

Commentaires

Ressources supplémentaires