Partilhar via


Cronograma de trabalhos

A linha do tempo de trabalhos é um ótimo ponto de partida para entender seu pipeline ou consulta. Ele fornece uma visão geral do que estava em execução, quanto tempo cada etapa levou e se houve alguma falha ao longo do caminho.

Como abrir o cronograma de vagas

Na interface do Spark, clique em Trabalhos e Linha Temporal de Eventos conforme destacado em vermelho na captura de tela a seguir. Você verá a linha do tempo. Este exemplo mostra o driver e o executor 0 sendo adicionados:

Cronograma de Trabalhos

O que procurar

As secções abaixo explicam como ler a linha cronológica de eventos para descobrir a possível causa do problema de desempenho ou custo. Se você notar qualquer uma dessas tendências em sua linha do tempo, o final de cada seção correspondente contém um link para um artigo que fornece orientação.

Trabalhos com falha ou executores com falha

Aqui está um exemplo de um trabalho que falhou e de executores removidos, indicado por um status vermelho, na cronologia do evento.

Empregos Fracassados

Se você vir trabalhos com falha ou executores com falha, consulte Trabalhos com falha ou executores removidos.

Lacunas na execução

Procure intervalos de um minuto ou mais, como neste exemplo:

Lacunas de emprego

Este exemplo tem várias lacunas, algumas das quais são realçadas pelas setas vermelhas. Se você vir lacunas em sua linha do tempo, elas são de um minuto ou mais? São de esperar intervalos curtos à medida que o condutor coordena o trabalho. Se você tiver lacunas maiores, elas estão no meio de um gasoduto? Ou esse cluster está em constante execução e, portanto, as lacunas são explicadas por pausas na atividade? Talvez seja possível determinar isso com base na hora em que sua carga de trabalho começou e terminou.

Se vires lacunas longas e inexplicáveis no meio de um pipeline, consulta Lacunas entre trabalhos do Spark.

Trabalhos longos

A cronologia é dominada por um ou alguns trabalhos longos? Estes longos trabalhos seriam algo a ser investigado. No exemplo a seguir, a carga de trabalho tem uma tarefa consideravelmente mais longa do que as outras. Este é um bom alvo de investigação.

Trabalhos Longos

Clique no trabalho mais longo para se aprofundar. Para obter informações sobre como investigar esse estágio longo, consulte Diagnosticando um estágio longo no Spark.

Muitos pequenos trabalhos

O que estamos procurando aqui é uma linha do tempo dominada por trabalhos minúsculos. Pode ser algo como isto:

Pequenos Empregos

Observe todas as pequenas linhas azuis. Cada um deles é um pequeno trabalho que levou alguns segundos ou menos.

Se a sua cronologia for maioritariamente de pequenos trabalhos, consulte Muitos pequenos trabalhos do Spark.

Nenhuma das opções acima

Se a sua linha do tempo não se parece com nenhuma das anteriores, o próximo passo é identificar o trabalho mais longo. Classifique os trabalhos por duração e clique no link na descrição do trabalho mais longo:

Identificação do trabalho mais longo

Quando você está na página do trabalho mais longo, informações adicionais sobre como investigar essa longa etapa estão em Diagnosticando uma longa etapa em Spark.