Compartilhar via


Como determinar se o Spark está reescrevendo os dados

Primeiro, abra o DAG do SQL no seu estágio de gravação. Role até a parte superior da página do trabalho e clique na Consulta SQL Associada:

Estágio para SQL

Você já deve ver o DAG. Caso contrário, role um pouco e você deverá vê-lo:

DAG do SQL

Se estiver realizando uma operação de Excluir ou Atualizar, observe a quantidade de dados que está sendo gravada pelo gravador em comparação com o que você espera. Se você estiver vendo muito mais dados sendo gravados do que o esperado, é provável que você esteja reescrevendo esses dados:

Estatísticas de Gravação

Se você estiver mesclando, o nó de mesclagem terá estatísticas explícitas sobre a quantidade de dados que está sendo reescrita.