Identificando uma leitura cara no DAG do Spark
Como chegar ao DAG
Supondo que você esteja olhando para um trabalho caro, primeiro precisamos do ID do estágio que está fazendo a leitura. Aqui podemos ver o ID do Estágio é 194:
Agora precisamos chegar ao SQL DAG. Role para cima até a parte superior da página do trabalho e clique na Consulta SQL associada:
Agora você deve ver o DAG. Se não, role um pouco e você deve vê-lo:
Em alguns casos, você pode seguir o DAG e ver de onde os dados estão vindo. Em outros casos, procure o ID do estágio que você observou:
Então você precisa procurar o nó "Scan". Neste caso, é muito simples dizer que estamos lendo uma tabela chamada transactions
:
Em alguns casos, pode ser necessário clicar ou rolar o nó para obter a localização dos dados que está lendo.