Определение ресурсоемкого чтения в DAG Spark

Статья
01/22/2025

Получение к DAG

Предположим, что вы рассматриваете дорогостоящую работу, сначала нам нужно получить идентификатор этапа, который выполняет чтение. Здесь мы видим, что идентификатор этапа равен 194:

идентификатор этапа

Теперь нам нужно добраться до DAG SQL. Прокрутите вверх до начала страницы задания и нажмите связанный запрос SQL.

SQL идентификатор

Теперь вы должны увидеть DAG. Если нет, прокрутите немного и увидите следующее:

SQL DAG

В некоторых случаях можно следить за DAG и видеть, откуда приходят данные. В других случаях найдите идентификатор этапа, который вы указали:

Этап SQL в DAG

Затем необходимо найти узел "Скан". В этом случае довольно просто сказать, что мы читаем таблицу с именем transactions:

сканирование в DAG

В некоторых случаях может потребоваться щелкнуть на узел или навести на него курсор, чтобы определить местоположение данных, которые вы просматриваете.

Поделиться через

Определение ресурсоемкого чтения в DAG Spark

Получение к DAG

Обратная связь

Дополнительные ресурсы