Udostępnij za pośrednictwem


Identyfikowanie kosztownego odczytu w języku DAG platformy Spark

Uzyskiwanie do grupy dag

Przy założeniu, że patrzysz na kosztowne zadanie, najpierw potrzebujemy identyfikatora etapu, który wykonuje odczyt. W tym miejscu widać, że identyfikator etapu to 194:

Identyfikator etapu

Teraz musimy przejść do grupy DAG SQL. Przewiń w górę do góry strony zadania i kliknij skojarzone zapytanie SQL:

Identyfikator SQL

Powinna zostać wyświetlona grupa DAG. Jeśli nie, przewiń nieco i powinien zostać wyświetlony:

SQL DAG

W niektórych przypadkach możesz śledzić grupę DAG i zobaczyć, skąd pochodzą dane. W innych przypadkach wyszukaj zanotowany identyfikator etapu:

Etap SQL w języku DAG

Następnie należy wyszukać węzeł "Skanuj". W tym przypadku dość proste jest powiedzenie, że odczytujemy tabelę o nazwie transactions:

Skanowanie w grupie DAG

W niektórych przypadkach może być konieczne kliknięcie lub przerzucić węzeł, aby uzyskać lokalizację odczytywanych danych.