Använda Synapse Studio för att övervaka dina Apache Spark-program

Artikel
06/01/2023

Med Azure Synapse Analytics kan du använda Apache Spark för att köra notebook-filer, jobb och andra typer av program på dina Apache Spark-pooler på din arbetsyta.

Den här artikeln beskriver hur du övervakar dina Apache Spark-program så att du kan hålla ett öga på den senaste statusen, problemen och förloppet.

Visa Apache Spark-program

Du kan visa alla Apache Spark-program från Monitor -Apache Spark-program>.

Skärmbild av Apache Spark-program.

Visa slutförda Apache Spark-program

Öppna Övervaka och välj sedan Apache Spark-program. Om du vill visa information om de slutförda Apache Spark-programmen väljer du Apache Spark-programmet.

Skärmbild av slutförd jobbinformation.

Kontrollera varaktigheten Slutförda aktiviteter, Status och Total.
Uppdatera jobbet.
Klicka på Jämför program för att använda jämförelsefunktionen. Mer information om den här funktionen finns i Jämför Apache Spark-program.
Klicka på Spark-historikservern för att öppna sidan Historikserver.
Kontrollera sammanfattningsinformationen .
Kontrollera diagnostiken på fliken Diagnostik .
Kontrollera loggarna. Du kan visa en fullständig logg över Livy-, Prelaunch- och Driver-loggarna genom att välja olika alternativ i listrutan. Och du kan hämta nödvändig logginformation direkt genom att söka efter nyckelord. Klicka på Ladda ned logg för att ladda ned logginformationen till den lokala platsen och markera kryssrutan Filtrera fel och varningar för att filtrera de fel och varningar du behöver.
Du kan se en översikt över ditt jobb i det genererade jobbdiagrammet. Som standard visar diagrammet alla jobb. Du kan filtrera den här vyn efter jobb-ID.
Som standard är förloppsvisningen markerad. Du kan kontrollera dataflödet genom att välja Förlopp/skriven/varaktighet förläsning/ i listrutan Visa.
Om du vill spela upp jobbet klickar du på knappen Uppspelning . Du kan när som helst klicka på knappen Stoppa för att stoppa.
Använd rullningslisten för att zooma in och zooma ut jobbdiagrammet. Du kan också välja Zooma till Anpassa för att få det att passa skärmen.

Jobbdiagramnoden visar följande information för varje steg:
- Job-ID
- Aktivitetsnummer
- Varaktighetstid
- Radantal
- Läsdata: summan av indatastorleken och shuffle-lässtorleken
- Skrivna data: summan av utdatastorleken och shuffle-skrivstorleken
- Stegnummer
Håll muspekaren över ett jobb så visas jobbinformationen i knappbeskrivningen:
- Ikon för jobbstatus: Om jobbstatusen lyckas visas den som en grön "√"; om jobbet upptäcker ett problem visas ett gult "!"
- Job-ID
- Allmän del:
  - Förlopp
  - Varaktighetstid
  - Totalt uppgiftsnummer
- Datadel:
  - Totalt antal rader
  - Lässtorlek
  - Skriven storlek
- Snedställ del:
  - Skjuvade data
  - Tidsförskjutning
- Stegnummer
Klicka på Stegnummer för att expandera alla faser i jobbet. Klicka på Dölj bredvid jobb-ID:t för att minimera alla faser i jobbet.
Klicka på Visa information i ett stegdiagram. Informationen för en fas visas.

Övervaka Förloppet för Apache Spark-programmet

Öppna Övervaka och välj sedan Apache Spark-program. Om du vill visa information om De Apache Spark-program som körs väljer du det skickade Apache Spark-programmet. Om Apache Spark-programmet fortfarande körs kan du övervaka förloppet.

Skärmbild av valt jobb som körs

Kontrollera varaktigheten Slutförda aktiviteter, Status och Total.
Avbryt Apache Spark-programmet.
Uppdatera jobbet.
Klicka på knappen Spark-användargränssnitt för att gå till sidan Spark-jobb.
För jobbdiagram, sammanfattning, diagnostik, loggar. Du kan se en översikt över ditt jobb i det genererade jobbdiagrammet. Se steg 5–15 i Visa slutförda Apache Spark-program.

Visa avbrutna Apache Spark-program

Öppna Övervaka och välj sedan Apache Spark-program. Om du vill visa information om de avbrutna Apache Spark-programmen väljer du Apache Spark-programmet.

Skärmbild av avbrutet jobb.

Kontrollera varaktigheten Slutförda aktiviteter, Status och Total.
Uppdatera jobbet.
Klicka på Jämför program för att använda jämförelsefunktionen. Mer information om den här funktionen finns i Jämför Apache Spark-program.
Öppna länken för Apache-historikservern genom att klicka på Spark-historikservern.
Visa diagrammet. Du kan se en översikt över ditt jobb i det genererade jobbdiagrammet. Se steg 5–15 i Visa slutförda Apache Spark-program.

Felsöka apache Spark-program som misslyckades

Öppna Övervaka och välj sedan Apache Spark-program. Om du vill visa information om de misslyckade Apache Spark-programmen väljer du Apache Spark-programmet.

Skärmbild av misslyckat jobb.

Kontrollera varaktigheten Slutförda aktiviteter, Status och Total.
Uppdatera jobbet.
Klicka på Jämför program för att använda jämförelsefunktionen. Mer information om den här funktionen finns i Jämför Apache Spark-program.
Öppna länken för Apache-historikservern genom att klicka på Spark-historikservern.
Visa diagrammet. Du kan se en översikt över ditt jobb i det genererade jobbdiagrammet. Se steg 5–15 i Visa slutförda Apache Spark-program.

Visa indata/utdata

Välj ett Apache Spark-program och klicka på fliken Indata/utdata för att visa datum för indata och utdata för Apache Spark-programmet. Den här funktionen kan hjälpa dig att felsöka Spark-jobbet. Och datakällan stöder tre lagringsmetoder: gen1, gen2 och blob.

Fliken Indata

Klicka på knappen Kopiera indata för att klistra in indatafilen lokalt.
Klicka på knappen Exportera till CSV för att exportera indatafilen i CSV-format.
Du kan söka efter filer efter indatanyckelord i sökrutan (nyckelord inkluderar filnamn, läsformat och sökväg).
Du kan sortera indatafilerna genom att klicka på Namn, Läs format och sökväg.
Använd musen för att hovra över en indatafil. Ikonen för knappen Ladda ned/kopiera sökväg/Mer visas.

Skärmbild av fliken Indata.

Klicka på knappen Mer . Kopieringssökvägen/Visa i utforskaren/Egenskaper visas på snabbmenyn.
- Kopieringssökväg: kan kopiera fullständig sökväg och relativ sökväg.
- Visa i Utforskaren: kan hoppa till det länkade lagringskontot (datalänkad>).
- Egenskaper: visa de grundläggande egenskaperna för filen (Filnamn/Filsökväg/Läsformat/Storlek/Ändrad).

Fliken Utdata

Visar samma funktioner som indatafliken.

Skärmbild av utdata.

Jämföra Apache Spark-program

Det finns två sätt att jämföra program. Du kan jämföra genom att välja Jämför program eller klicka på knappen Jämför i anteckningsbok för att visa det i notebook-filen.

Jämför efter program

Klicka på knappen Jämför program och välj ett program för att jämföra prestanda. Du kan se skillnaden mellan de två programmen.

Skärmbild av jämför program.

Skärmbild av information om hur du jämför program.

Använd musen för att hovra över ett program och sedan visas ikonen Jämför program .
Klicka på ikonen Jämför program så visas sidan Jämför program.
Klicka på knappen Välj program för att öppna sidan Välj jämförelseprogram .
När du väljer jämförelseprogrammet måste du antingen ange programmets URL eller välja från den återkommande listan. Klicka sedan på OK .
Jämförelseresultatet visas på sidan jämför program.

Jämför i notebook-fil

Klicka på knappen Jämför i anteckningsbok på sidan Jämför program för att öppna anteckningsboken. Standardnamnet för .ipynb-filen är Recurrent Application Analytics.

Skärmbild av jämförelse i notebook-fil.

I notebook-filen Notebook: Recurrent Application Analytics kan du köra den direkt när du har angett Spark-poolen och Språk.

Skärmbild av återkommande programanalys.

Nästa steg

Mer information om hur du övervakar pipelinekörningar finns i artikeln Övervaka pipelinekörningar med Synapse Studio.

Dela via