Kiedy używać usługi Azure Data Factory
W tej lekcji omówimy sposób określania, czy usługa Azure Data Factory jest odpowiednim rozwiązaniem integracji danych dla Twojej organizacji. Oceniamy usługę Azure Data Factory pod kątem następujących kryteriów:
- Wymagania dotyczące integracji danych
- Zasoby kodowania
- Obsługa wielu źródeł danych
- Infrastruktura bezserwerowa
Kryteria decyzji
Aby określić, czy używać usługi Azure Data Factory, użyj kryteriów opisanych w poniższej tabeli.
Kryterium | Analiza |
---|---|
Czy w ogóle potrzebujesz integracji danych? | Jeśli Organizacja współpracuje z danymi big data lub jest tradycyjną organizacją magazynowania danych relacyjnych, być może interesuje Cię rozwiązanie integracji danych. |
Czy potrzebne są zasoby kodowania? | Nie wszyscy, którzy pracują z danymi, są doświadczeni w kodowaniu. Niektórzy mogą preferować pracę z narzędziami graficznymi, które udostępniają wizualizacje, aby ułatwić tworzenie zadań, które współpracują z danymi źródłowymi. |
Czy musisz pracować z wieloma źródłami danych? | Niektóre organizacje mogą mieć nieprzetworzone dane przechowywane w różnych systemach, zarówno w środowisku lokalnym, jak i w chmurze. Rozwiązanie do analizy danych musi mieć możliwość łatwego łączenia się z wieloma źródłami danych. |
Czy można tworzyć i obsługiwać oddzielne składniki integracji danych oraz zarządzać nimi? | Bez zarządzanej usługi do analizy danych przedsiębiorstwa muszą tworzyć niestandardowe składniki przenoszenia danych. Alternatywnie mogą tworzyć usługi niestandardowe w celu zintegrowania źródeł danych i przetwarzania. Integracja i konserwacja takich systemów może być kosztowna i trudna. Ponadto nie wszystkie takie systemy mają funkcje monitorowania, alertów i kontroli oferowanych przez w pełni zarządzaną usługę. |
Stosowanie kryteriów
Zapoznaj się z poniższymi pytaniami podczas rozważania usługi Azure Data Factory jako rozwiązania do integracji danych.
Czy w ogóle potrzebujesz integracji danych?
Jeśli twoja organizacja jest mała i współpracuje z ograniczonymi źródłami danych, usługa integracji danych w ogóle nie jest wymagana. Jeśli jednak organizacja współpracuje z danymi big data lub jest tradycyjną organizacją magazynowania danych relacyjnych, możesz skorzystać z rozwiązania do integracji danych. Rozważ następujące punkty:
- Organizacje danych big data korzystają z technologii do obsługi dużych ilości różnorodnych danych. W przypadku nich usługa Azure Data Factory umożliwia tworzenie i uruchamianie potoków w chmurze. Te potoki mogą uzyskiwać dostęp zarówno do usług danych w chmurze, jak i lokalnych. Te potoki zwykle współpracują z technologiami, takimi jak Azure Synapse Analytics, Azure Blobs i Azure Data Lake. Ponadto usługi Azure HDInsight, Azure Databricks i Azure Machine Learning.
- Organizacje magazynowania danych relacyjnych zwykle korzystają z technologii, takich jak SQL Server. Usługi SQL Server Integration Services (SSIS) są często używane do tworzenia pakietów usług SSIS. W przypadku takich organizacji usługa Azure Data Factory zapewnia im możliwość uruchamiania pakietów usług SSIS na platformie Azure, umożliwiając im dostęp zarówno do usług danych w chmurze, jak i lokalnych.
Czy potrzebne są zasoby kodowania?
Jeśli twoja organizacja nie ma niezbędnych zasobów kodowania w celu utworzenia wymaganych działań, rozważ usługę Azure Data Factory. Usługa Azure Data Factory udostępnia niski proces kodu/bez kodu do pracy ze źródłami danych i powiązanymi działaniami. Na przykład narzędzie do tworzenia i monitorowania usługi Azure Data Factory umożliwia graficzne tworzenie potoków przez przeciąganie i upuszczanie działań na powierzchni projektowej. Poniższy zrzut ekranu przedstawia interfejs, w którym inżynier danych tworzy potok z kilkoma działaniami:
Czy musisz pracować z wieloma źródłami danych?
Jeśli twoja organizacja wymaga dostępu do danych w wielu lokalizacjach i z wielu źródeł, należy rozważyć rozwiązanie integracji danych, które zapewnia tę obsługę. Usługa Azure Data Factory używa łączników do integracji z różnymi źródłami danych. Obecnie jest obsługiwanych ponad 90 źródeł danych. Ponadto usługa Azure Data Factory obsługuje rozszerzalne opcje dotarcia do innych źródeł danych.
Czy można tworzyć i obsługiwać oddzielne składniki integracji danych oraz zarządzać nimi?
Tworzenie własnego rozwiązania do integracji danych opartego na serwerze i zarządzanie nim może być skomplikowane i czasochłonne. Jeśli jednak takie rozwiązanie w centrum danych organizacji działa dla Ciebie, nie musisz brać pod uwagę usługi Azure Data Factory. Istnieją jednak zalety korzystania z w pełni zarządzanego rozwiązania bezserwerowego na potrzeby integracji danych. Najważniejsze korzyści to:
- Możliwość skalowania zgodnie z potrzebami w celu obsługi większej liczby obciążeń.
- Nie trzeba wdrażać, konfigurować i obsługiwać serwerów do hostowania obciążeń integracji danych.
Podsumowanie
Podsumowując, rozważ usługę Azure Data Factory, jeśli spełniasz co najmniej jedno z następujących kryteriów:
- Inżynierowie danych nie mają czasu niezbędnego do utworzenia kodu w celu wykonywania zadań analizy danych.
- Istnieje wiele źródeł danych w różnych lokalizacjach.
- Chcesz skorzystać z w pełni zarządzanego rozwiązania opartego na chmurze.