Co to jest zadanie platformy Apache Airflow?
Uwaga
Zadanie apache Airflow jest obsługiwane przez platformę Apache Airflow.
Zadanie apache Airflow to następna generacja menedżera orkiestracji przepływu pracy usługi Azure Data Factory. Jest to prosty i wydajny sposób tworzenia zadań orkiestracji platformy Apache Airflow i zarządzania nimi, co umożliwia łatwe uruchamianie grafów Acyklicznych (DAG, Directed Acyclic Graphs) na dużą skalę. Jest to część usługi Data Factory sieci Szkieletowej, która umożliwia nowoczesne środowisko integracji danych w celu pozyskiwania, przygotowywania i przekształcania danych z bogatego zestawu źródeł danych, na przykład baz danych, magazynu danych, usługi Lakehouse, danych w czasie rzeczywistym i nie tylko.
Kiedy używać zadania apache Airflow?
Zadania platformy Apache Airflow oferują zarządzaną usługę, która umożliwia użytkownikom tworzenie grup DAG opartych na języku Python (skierowanych grafów Acyklicznych) na potrzeby orkiestracji przepływu pracy bez obaw o podstawową infrastrukturę. Jeśli masz doświadczenie z platformą Apache Airflow lub preferujesz podejście skoncentrowane na kodzie, ta opcja jest idealna. Natomiast jeśli wolisz rozwiązanie bez kodu do orkiestracji danych, potoki danych oferują przyjazną dla użytkownika alternatywę, która nie wymaga zarządzania ani pisania przepływów pracy opartych na języku Python.
Najważniejsze funkcje
Zadanie platformy Apache Airflow hostowane w usłudze Microsoft Fabric oferuje szereg zaawansowanych funkcji, w tym:
Najważniejsze funkcje | Zadanie apache Airflow w sieci szkieletowej | Menedżer orkiestracji przepływu pracy w usłudze Azure Data Factory |
---|---|---|
Synchronizacja usługi Git | Tak | Tak |
Włączanie usługi AKV (Azure Key Vault) jako zaplecza | Tak | Tak |
Zainstaluj pakiet prywatny zgodnie z wymaganiami | Tak | Tak |
Dzienniki diagnostyczne i metryki | Nie. | Tak |
Blob Storage | Nie. | Tak |
Adres IP klastra Apache Airflow | Tak | Tak |
Automatyczne skalowanie na potrzeby zarządzania skokami wykonywania obciążeń produkcyjnych | Tak | Częściowe |
Wysoka dostępność w celu ograniczenia awarii/przestoju | Tak | Nie. |
Operatory z możliwością odroczenia w przypadku wstrzymania bezczynnych operatorów i zwalniania pracowników | Tak | Nie. |
Wstrzymywanie i wznawianie czasu wygaśnięcia (czas wygaśnięcia) | Tak | Nie. |
Środowisko SaaSified — 10 sekund, aby rozpocząć pracę — Tworzenie grup DAG — bezpłatna wersja próbna sieci szkieletowej | Tak | Nie. |
Dostępność regionów (publiczna wersja zapoznawcza)
- Australia Wschodnia
- Australia Południowo-Wschodnia
- Brazylia Południowa
- Kanada Wschodnia
- Kanada Środkowa
- Azja Wschodnia
- East US
- Niemcy Środkowo-Zachodnie
- Japonia Wschodnia
- Japonia Zachodnia
- Europa Północna
- Północna Republika Południowej Afryki
- South Central US
- Indie Południowe
- Southeast Asia
- Szwecja Środkowa
- Szwajcaria Zachodnia
- Południowe Zjednoczone Królestwo
- Zachodnie Zjednoczone Królestwo
- Zachodnio-środkowe stany USA
- West Europe
- Zachodnie stany USA
Obsługiwane wersje platformy Apache Airflow
- 2.6.3
Obsługa wersji języka Python
- 3.8.17
Uwaga
Zmiana wersji platformy Apache Airflow w istniejącym środowisku IR nie jest obsługiwana. Zamiast tego zalecanym rozwiązaniem jest utworzenie nowego środowiska Ir Airflow z żądaną wersją
Powiązana zawartość
- Szybki start: tworzenie zadania platformy Apache Airflow.