Principy toku řízení datové továrny

Dokončeno

Co je tok řízení

Tok řízení je orchestrace aktivit kanálu, která zahrnuje řetězení aktivit v posloupnosti, větvení, definování parametrů na úrovni kanálu a předávání argumentů při vyvolání kanálu na vyžádání nebo z triggeru.

Tok řízení může také zahrnovat kontejnery smyček, které můžou předávat informace pro každou iteraci kontejneru smyčky.

Pokud se smyčka For Each používá jako aktivita toku řízení, azure Data Factory může pomocí tohoto přístupu paralelně spouštět více aktivit. Díky tomu můžete vytvářet komplexní a iterativní logiku zpracování v kanálech, které vytvoříte pomocí azure Data Factory, což podporuje vytváření různorodých vzorů integrace dat, jako je vytvoření moderního datového skladu.

Některé běžné aktivity toku řízení jsou popsány v následujících částech.

Řetězení aktivit

Ve službě Azure Data Factory můžete řetězit aktivity v posloupnosti v rámci kanálu. Vlastnost dependsOn v definici aktivity je možné použít ke zřetězení s upstreamovou aktivitou.

Větvení aktivit

Azure Data Factory můžete použít k větvení aktivit v rámci kanálu. Příkladem aktivity větvení je aktivita if-condition , která se podobá příkazu if poskytnutému v programovacích jazycích. Aktivita větvení vyhodnocuje sadu aktivit a když se podmínka vyhodnotí jako pravdivá, provede se sada aktivit. Když se vyhodnotí jako nepravda, provede se alternativní sada aktivit.

Parametry

Parametry můžete definovat na úrovni kanálu a při volání kanálu na vyžádání nebo pomocí aktivační události potom předávat argumenty. Aktivity pak spotřebovávají argumenty uchovávané v parametru při jejich předání do kanálu.

Předávání vlastního stavu

Předání vlastního stavu je možné pomocí služby Azure Data Factory. Předání vlastního stavu je aktivita, která vytvořila výstup nebo stav aktivity, kterou je potřeba využívat následnou aktivitou v kanálu. Příkladem je to, že v definici JSON aktivity můžete získat přístup k výstupu předchozí aktivity. Použití předávání vlastního stavu umožňuje vytvářet pracovní postupy, ve kterých hodnoty procházejí aktivitami.

Kontejnery smyček

Kontejnery smyček, které zastřešují tok řízení, jako je aktivita ForEach, definuje opakování v kanálu. Umožňuje iterovat kolekci a spouštět zadané aktivity v definované smyčce. Funguje podobně jako "pro každou strukturu smyček", která se používá v programovacích jazycích. Kromě každé aktivity existuje také aktivita Until. Tato funkce se podobá smyčce do-until používané při programování. To, co dělá, spouští sadu aktivit (dělá) ve smyčce, dokud není splněna podmínka (dokud) není splněna.

Toky založené na aktivačních událostech

Kanály je možné aktivovat na vyžádání (například na základě událostí) nebo hodinovým časem.

Vyvolání kanálu z jiného kanálu

Aktivita Spuštění kanálu s Azure Data Factory umožňuje kanálu Data Factory vyvolat jiný kanál.

Toky rozdílů

Případy použití související s používáním rozdílových toků jsou rozdílové zatížení. Rozdílové načtení v vzorech ETL načte pouze data, která se změnila od předchozí iterace kanálu. Možnosti, jako je aktivita vyhledávání a flexibilní plánování, pomáhají zpracovávat rozdílové úlohy načítání. V případě použití aktivity Vyhledávání přečte nebo vyhledá hodnotu názvu záznamu nebo tabulky z jakéhokoli externího zdroje. Na tento výstup mohou dále odkazovat následující aktivity.

Další řídicí toky

Existuje mnoho dalších aktivit toku řízení. Další užitečné aktivity najdete v následujících položkách:

  • Webová aktivita: Webová aktivita ve službě Azure Data Factory pomocí toků řízení může volat vlastní bod RESTendpoint z kanálu služby Data Factory. Datové sady a propojené služby je možné předat, aby aktivita mohla využívat.

  • Aktivita Získání metadat: Aktivita Získat metadata načte metadata všech dat ve službě Azure Data Factory.