Migrowanie z usługi Azure Data Factory do usługi Data Factory w usłudze Microsoft Fabric
Ten artykuł dotyczy twórców potoków usług Azure Data Factory i Synapse Gen2. Zawiera ona wskazówki i uzasadnienie, które ułatwiają modernizację i migrowanie potoków do usługi Data Factory dla usługi Microsoft Fabric.
Tło
Microsoft Fabric to zintegrowana platforma zarówno dla danych przedsiębiorstwa samoobsługowego, jak i zarządzanego przez IT. Wraz ze wzrostem wykładniczym ilości danych i złożoności klienci Fabric domagają się rozwiązań dla przedsiębiorstw, które można skalować, są łatwe do zarządzania, bezpieczne i dostępne dla wszystkich użytkowników w największych organizacjach.
W ostatnich latach firma Microsoft zainwestowała znaczącą pracę, aby zapewnić klientom skalowalne możliwości chmury. W tym celu usługa Data Factory w Fabric umożliwia korzystanie z dużego ekosystemu deweloperów integracji danych oraz rozwiązań do integracji danych, budowanego przez dziesięciolecia, w pełnym zakresie funkcji i możliwości, które znacznie wykraczają poza porównywalną funkcjonalność dostępną w poprzednich generacjach.
Oczywiście klienci pytają, czy istnieje możliwość konsolidacji przez hostowanie rozwiązań integracji danych w usłudze Fabric. Często zadają pytania, takie jak:
- Czy cała funkcjonalność, na której polegamy, działa w potokach Fabric?
- Jakie funkcje są dostępne tylko w potokach Fabric?
- Jak przenieść istniejące potoki do potoków Fabric?
- Co to jest plan firmy Microsoft dotyczący pozyskiwania danych przedsiębiorstwa?
Odpowiedzi na wiele z tych pytań zostały opisane w tym artykule.
Notatka
Decyzja o migracji do pojemności Fabric zależy od wymagań każdego klienta. Klienci powinni dokładnie ocenić inne korzyści, aby podjąć świadomą decyzję. Oczekujemy, że z czasem nastąpi naturalna migracja do Fabric pipelines, a naszym zamiarem jest, aby odbywała się na warunkach odpowiadających każdemu klientowi.
Obecnie nie ma żadnych planów wycofania usługi Azure Data Factory ani Synapse Gen2 na potrzeby pozyskiwania danych. Priorytetem jest skupienie się na inwestycjach w potoki Fabric na potrzeby pozyskiwania danych przedsiębiorstwa, więc dodatkowa wartość zapewniana przez pojemność Fabric zwiększy się wraz z upływem czasu. Klienci, którzy wybierają pojemności Fabric, mogą oczekiwać korzyści z zgodności z planem rozwoju produktu Microsoft Fabric.
Zbieżność integracji danych przedsiębiorstwa i samoobsługi
Konsolidacja elementów w usłudze Fabric upraszcza odnajdywanie, współpracę i zarządzanie poprzez umiejscawianie zasobów. Dzięki temu centralne zespoły IT mogą operacjonalizować usługi przenoszenia i przekształcania danych o krytycznym znaczeniu dostosowane do standardów firmy, w tym pochodzenia danych i monitorowania, a jednocześnie łatwiej integrować popularne elementy samoobsługi.
Aby obsługiwać wspólne i skalowalne potrzeby organizacji, potoki Fabric wprowadzają działania Office 365 i Teams do wysyłania wiadomości, bezproblemowego odświeżania modeli semantycznych Power BI oraz silne funkcje zarządzania, pomagając organizacjom zarządzać pochodzeniem danych i monitorowaniem potoków. Integracja generatywnej sztucznej inteligencji za pośrednictwem Copilot dodatkowo rozszerza środowisko potoku, oferując inteligentne generowanie potoków i wyjaśnienia rozwiązywania błędów, upraszczając tworzenie i zarządzanie złożonymi rozwiązaniami.
Korzystając ze wspólnej platformy, przepływ pracy jest usprawniony, zwiększając rozwijanie rozwiązań między biznesem a IT. Dzięki temu organizacje mogą skalować swoje rozwiązania danych na poziomy przedsiębiorstwa, zapewniając wysoką wydajność, elastyczność i wydajność w zarządzaniu ogromnymi ilościami danych.
Pojemności sieci szkieletowej
Ze względu na architekturę rozproszoną, możliwości Fabric są mniej wrażliwe na ogólne obciążenie, skoki czasowe i wysoką współbieżność. Konsolidując pojemności w większe jednostki SKU pojemności Fabric, klienci mogą osiągnąć zwiększoną wydajność i przepływność.
Porównanie funkcji
W poniższej tabeli wymieniono funkcje obsługiwane w usługach Azure Data Factory i Fabric Data Factory.
Cecha | Azure Data Factory | Fabryka danych Fabric |
---|---|---|
działania w linii produkcyjnej | ||
działania usługi Office 365 i Teams umożliwiają bezproblemowe wysyłanie komunikatów, ułatwianie wydajnej komunikacji i współpracy w całej organizacji | Nie | Tak |
Tworzenie połączeń z modelu semantycznego usługi Power BI oraz Dataflow Gen2, aby upewnić się, że dane są stale odświeżane i aktualne up-to. | Nie | Tak |
pl-PL: Weryfikacja w potoku, aby upewnić się, że potok kontynuuje wykonywanie tylko po potwierdzeniu, że dołączone odwołanie do zestawu danych istnieje i spełnia określone kryteria, lub jeśli limit czasu zostanie przekroczony. | Tak | Tak1 |
Wykonaj pakiet SQL Server Integration Services (SSIS), aby przeprowadzić operacje integracji i transformacji danych. | Tak | Planowany |
Przekształcanie danych | ||
Wizualnie zaprojektowane przekształcenia danych przy użyciu klastrów Apache Spark z przepływami danych mapowania w celu tworzenia procesów przekształcania danych i zarządzania nimi za pomocą interfejsu graficznego | Tak | Brak2 |
Wizualnie zaprojektowane przekształcenia danych przy użyciu silnika obliczeniowego Fabric z intuicyjnym graficznym interfejsem Power Query w usłudze Dataflow Gen2 | Nie | Tak |
Łączność | ||
Obsługa wszystkich źródeł danych usługi Data Factory | Tak | W toku3 |
skalowalność | ||
Zapewnij bezproblemowe realizowanie działań w ramach potoku z zaplanowanymi przebiegami | Tak | Tak |
Planowanie wielu przebiegów dla jednego potoku w celu elastycznego i wydajnego zarządzania potokami | Tak | zaplanowane |
Korzystanie z wyzwalaczy okien czasowych przesuniętych do planowania przebiegów potoków w odrębnych, niezachodzących na siebie oknach czasowych | Tak | zaplanowane |
Wyzwalacze zdarzeń do automatyzacji wykonywania przebiegów pipeline'u w odpowiedzi na określone lub istotne wystąpienia zdarzeń. | Tak | Tak4 |
Sztuczna inteligencja | ||
Copilot for Data Factory, który zapewnia inteligentne generowanie potoków umożliwiające łatwe pozyskiwanie danych i dostarcza wyjaśnienia, aby lepiej zrozumieć złożone potoki lub udostępniać sugestie dotyczące komunikatów o błędach. | Nie | Tak |
zarządzanie zawartością | ||
widok pochodzenia danych, który pomaga użytkownikom zrozumieć i ocenić zależności potoku | Nie | Tak |
potoki wdrażania, które zarządzają cyklem życia zawartości | Nie | Tak |
Skalowalność i odporność platformy | ||
architektura Premium pojemności, która obsługuje zwiększoną skalę i wydajność | Nie | Tak |
Obsługa Multi-Geo, która pomaga klientom wielonarodowym spełnić wymagania dotyczące przechowywania danych regionalnych, branżowych lub organizacyjnych | Tak | Tak |
Bezpieczeństwo | ||
Brama danych sieci wirtualnej umożliwiająca łączność, która pozwala technologii Fabric na bezproblemowe działanie w sieci wirtualnej organizacji | Nie | zaplanowane |
Brama danych lokalnych łączności, która umożliwia bezpieczny dostęp do danych między lokalnymi źródłami danych i elementami platformy organizacji | Nie | Tak |
Obsługa tagów usługi Azure , które są zdefiniowaną grupą adresów IP, automatycznie zarządzaną w celu zminimalizowania złożoności aktualizacji lub zmian reguł zabezpieczeń sieciowych. | Tak | Tak |
Zarządzanie | ||
zawartości poświadczenie, aby promować lub certyfikować cenne, wysokiej jakości elementy materiałowe. | Nie | Tak |
integracji usługi Microsoft Purview, która ułatwia klientom zarządzanie i nadzorowanie elementami Fabric | Tak | Tak |
Etykiety poufności usługi Microsoft Information Protection (MIP) i integracja z usługą Microsoft Defender for Cloud Apps na potrzeby ochrony przed utratą danych | Nie | Tak |
monitorowanie i rejestrowanie diagnostyczne | ||
Rejestrowanie zdarzeń wykonywania potoku w magazynie zdarzeń w celu monitorowania, analizowania i rozwiązywania problemów z wydajnością potoku | Tak | Planowany |
koncentrator monitorowania, które zapewnia możliwości monitorowania elementów sieci Fabric | Nie | Tak |
aplikacja Microsoft Fabric Capacity Metrics, która zapewnia możliwości monitorowania pojemności Fabric | Nie | Tak |
dziennik inspekcji, który śledzi działania użytkowników w systemie Fabric oraz platformie Microsoft 365 | Nie | Tak |
1 Użyj Pobierz metadane, do i Jeśli warunek działania w celu pobrania równoważnych metadanych działania walidacji.
2 Użyj funkcji Wywoływanie zdalnego potoku, aby wykonać działania przepływu mapowania danych, zapoznaj się z Wywołaj działanie potoku.
3 Aby wyświetlić łączniki, które są obecnie obsługiwane dla potoków danych, zapoznaj się z tematem obsługa potoku .
4 Użyj Fabric eventstreams i Reflex do wyzwalania zdarzeń uruchomienia wykonania, zapoznaj się z wyzwalaczami zdarzeń potoku .
Zagadnienia dotyczące
Przed migracją do potoków Fabric należy wziąć pod uwagę inne kwestie.
Licencjonowania
Potoki Fabric wymagają co najmniej licencji Microsoft Fabric (wersja bezpłatna) na tworzenie w obszarze roboczym o pojemności Premium, aby dowiedzieć się więcej, zobacz Microsoft Fabric licencje.
Harmonogram działania
Dokumentacja planu wydania Microsoft Fabric informuje klientów o najnowszych aktualizacjach i harmonogramach oraz o nowych i planowanych funkcjach dla Data Factory w Microsoft Fabric, które są przygotowywane do przyszłych wersji.
Aby uzyskać więcej informacji, zobacz dokumentację planu wydania usługi Microsoft Fabric .
Powiązana zawartość
Dowiedz się, jak zaplanować migrację usługi ADF do usługi Fabric Data Factory.