Tijdlijn banen
De tijdlijn van taken is een uitstekend startpunt voor het begrijpen van uw pijplijn of query. Het geeft u een overzicht van wat er is uitgevoerd, hoe lang elke stap duurde en of er fouten zijn opgetreden.
De tijdlijn voor taken openen
Klik in de Spark-gebruikersinterface op Jobs en Gebeurtenissen Tijdlijn zoals gemarkeerd in rood, in de volgende schermafbeelding. U ziet de tijdlijn. In dit voorbeeld ziet u het stuurprogramma en uitvoerprogramma 0 dat wordt toegevoegd:
Tijdlijn voor
Waar moet ik naar zoeken?
In de onderstaande secties wordt uitgelegd hoe u de tijdlijn voor gebeurtenissen leest om de mogelijke oorzaak van uw prestatie- of kostenprobleem te ontdekken. Als u een van deze trends in uw tijdlijn ziet, bevat het einde van elke bijbehorende sectie een koppeling naar een artikel met richtlijnen.
Mislukkende taken of mislukte uitvoeringscomponenten
Hier volgt een voorbeeld van een mislukte taak en verwijderde uitvoerders, aangegeven met een rode status, in de gebeurtenistijdlijn.
Als u mislukte taken of mislukte uitvoerders ziet, raadpleegt u Mislukte taken of uitvoerders verwijderd uit de lijst.
Hiaten in uitvoering
Zoek naar hiaten van een minuut of meer, zoals in dit voorbeeld:
Dit voorbeeld heeft verschillende hiaten, waarvan er een aantal worden gemarkeerd door de rode pijlen. Als u hiaten in uw tijdlijn ziet, zijn deze dan een minuut of langer? Korte onderbrekingen worden verwacht als de chauffeur het werk coördineert. Als u langere hiaten hebt, bevinden ze zich in het midden van een pijplijn? Of is dit cluster constant actief en worden de hiaten veroorzaakt door onderbrekingen in de activiteit? Mogelijk kunt u dit bepalen op basis van het tijdstip waarop uw workload is gestart en beëindigd.
Als u lange onverklaarbare gaten in het midden van een pijplijn ziet, bekijk dan Gaten tussen Spark-taken.
Lange werkopdrachten
Wordt de tijdlijn gedomineerd door een of een paar lange taken? Deze lange banen zouden de moeite waard zijn om te onderzoeken. In het volgende voorbeeld heeft de werkbelasting één taak die veel langer is dan de andere. Dit is een goed doel voor onderzoek.
Klik op de langste taak om verder te onderzoeken. Zie Diagnose van een lange fase in Sparkvoor informatie over het onderzoeken van deze lange fase.
Veel kleine taken
Wat we hier zoeken, is een tijdlijn die wordt gedomineerd door kleine taken. Het ziet er ongeveer als volgt uit:
Let op alle kleine blauwe lijnen. Elk van deze is een kleine taak die een paar seconden of minder duurde.
Als uw overzicht voornamelijk kleine taken bevat, zie Veel kleine Spark-taken.
Geen van de bovenstaande
Als uw tijdlijn er niet uitziet als een van de bovenstaande, is de volgende stap het identificeren van de langste taak. Sorteer de taken op duur en klik op de koppeling in de beschrijving voor de langste taak:
Zodra u op de pagina voor de langste taak bent, bevindt aanvullende informatie over het onderzoeken van deze lange fase zich in Diagnose van een lange fase in Spark.