Uruchamianie sparametryzowanego zadania zadania usługi Azure Databricks w pętli
W tym artykule omówiono używanie For each
zadania z zadaniami usługi Azure Databricks, w tym szczegółowe informacje na temat dodawania i konfigurowania zadania w interfejsie użytkownika zadań. Użyj zadania For each
, aby uruchomić zadanie w pętli, przekazując inny zestaw parametrów do każdej iteracji zadania.
For each
Dodanie zadania do zadania wymaga zdefiniowania dwóch zadań: For each
zadania i zagnieżdżonego zadania. Zagnieżdżone zadanie to zadanie podrzędne do uruchomienia dla każdej iteracji For each
zadania i jest jednym ze standardowych typów zadań usługi Azure Databricks Jobs. Nie można dodać innego For each
zadania jako zagnieżdżonego zadania.
Można na przykład użyć zadania For each
do wykonania wspólnego zestawu przekształceń w wielu tabelach, przekazując nazwę tabeli z listy nazw tabel do każdej iteracji zadania.
Jakich typów parametrów można używać z For each
zadaniem?
Aby przekazać parametry z zadania For each
, możesz wykonać następujące czynności:
- Zdefiniuj kolekcję w formacie JSON podczas tworzenia lub edytowania zadania.
- Użyj wartości zadań przekazanych z poprzedniego zadania. Aby dowiedzieć się więcej o wartościach zadań, zobacz Używanie wartości zadań do przekazywania informacji między zadaniami.
- Użyj parametrów zadania. Aby dowiedzieć się więcej o parametrach zadania, zobacz Konfigurowanie parametrów zadania.
Aby dowiedzieć się, jak używać tych różnych typów parametrów podczas dodawania lub edytowania For each
zadania, zobacz następną sekcję Dodaj dla każdego zadania do zadania.
For each
Dodawanie zadania do zadania
Zadanie można dodać For each
podczas tworzenia zadania lub edytowania zadania w istniejącym zadaniu. Aby skonfigurować For each
zadanie:
W menu rozwijanym Typ wybierz pozycję Dla każdego.
Wprowadź nazwę zadania w polu Nazwa zadania.
W polu tekstowym Dane wejściowe zdefiniuj wartości dla zadania
For each
, które mają być iterowane. Może to być jeden z następujących elementów:tablica wartości w formacie JSON. Może to być tablica następujących typów danych:
- pary klucz-wartość
- Ciągi, liczby lub typy logiczne
- Dowolne złożone obiekty JSON
Odwołania do wartości zadania. Aby odwołać się do wartości zadań przekazanych z poprzedniego zadania, użyj składni
{{tasks.<task_name>.values.<task_value_name>}}
, aby ustawić wartość w polu tekstowym Dane wejściowe. Jeśli na przykład zadanie o nazwiegenerate_countries_list
poprzedzaFor each
zadanie, ustawia następującą wartość zadania:dbutils.jobs.taskValues.set(key = "countries", value = countries_array)
For each
Następnie zadanie odwołuje się do wartości zadania w polu tekstowym Dane wejściowe przy użyciu następującej składni:{{tasks.generate_countries_list.values.countries}}
.parametry zadania. Aby odwołać się do parametru zadania, użyj następującej składni w polu tekstowym Dane wejściowe :
{{job.parameters.<name>}}
. Na przykład{{job.parameters.countries}}
.
Aby opcjonalnie ustawić liczbę iteracji, które mogą być uruchamiane równolegle, wprowadź wartość współbieżności dla zadania. Domyślna wartość wynosi 1.
Aby opcjonalnie otrzymywać powiadomienia dotyczące uruchamiania, powodzenia lub niepowodzenia zadania, kliknij pozycję + Dodaj. Zobacz Dodawanie powiadomień dotyczących zadania.
Aby ukończyć konfigurację
For each
zadania i dodać zagnieżdżone zadanie do uruchomienia dla każdej iteracji, kliknij przycisk Dodaj zadanie do pętli.Wybierz typ zadania i opcje konfiguracji dla zagnieżdżonego zadania. Zagnieżdżone zadania są standardowymi typami zadań i mają te same opcje konfiguracji. Zobacz Konfigurowanie i edytowanie zadań usługi Databricks.
Aby odwołać się do parametrów przekazanych z zadania
For each
, kliknij pozycję Parametry. Użyj odwołania{{input}}
, aby ustawić wartość na odpowiadającą wartość w tablicy każdej iteracji lub{{input.<key>}}
, aby odwoływać się do poszczególnych pól obiektów podczas iteracji przez listę obiektów.Kliknij pozycję Utwórz zadanie.
Przełączanie For each
między zadaniem a zagnieżdżonym zadaniem
Zadanie For each
jest wyświetlane w interfejsie użytkownika zadań jako węzeł z zagnieżdżonym węzłem zadania wewnątrz węzła For each
. Aby przełączyć się między For each
zadaniem a zagnieżdżonym zadaniem, kliknij odpowiednie węzły.
Odwołanie do For each
zadania podrzędnego
Zadanie For each
jest zadaniem najwyższego poziomu, a podrzędne zadania mogą określać je jako zależność. Podrzędne zadania nie mogą zależeć od zadania zagnieżdżonego lub odwoływać się do tego zadania.
Uruchamianie i monitorowanie zadania za pomocą For each
zadania
Uruchamianie zadania z zadaniem jest identyczne z uruchamianiem For each
dowolnego innego zadania.
Wyświetlanie przebiegów zadań i zarządzanie nimi jest również identyczne z innymi zadaniami, z wyjątkiem historii uruchamiania zadań dla zadania For each
, które jest prezentowane jako tabela iteracji zadań. Zobacz Wyświetlanie historii uruchamiania zadań dla każdego zadania.