Kiedy należy używać usługi Azure HDInsight
Usługi HDInsight można używać do przetwarzania danych big data w wielu scenariuszach, przy użyciu danych historycznych lub w czasie rzeczywistym; ale czy powinieneś? Największą siłą usługi HDInsight jest szeroki zakres dostępnych konfiguracji. W tej lekcji rozważysz, czy usługa HDInsight jest właściwym wyborem dla twojej organizacji. Przeanalizujesz następujące kryteria, aby ułatwić podjęcie decyzji:
- Zakres obciążeń
- Skalowalność
- Odporność na uszkodzenia
- Zabezpieczenia
Kryteria decyzji
Aby określić, czy usługa HDInsight może spełniać potrzeby organizacji w zakresie danych big data, należy użyć kryteriów opisanych w poniższej tabeli:
Kryteria | Analiza |
---|---|
Zakres obciążeń | Jeśli potrzebujesz obsługi różnych obciążeń, potrzebujesz platformy, która może obsługiwać te wymagania. |
Skalowalność | Czy twoja organizacja musi skalować w celu dostosowania się do wzrostu ilości danych i szybkości danych? Ważne jest, aby wybrać platformę, która może być skalowana automatycznie i obsługiwać niezależne skalowanie zasobów obliczeniowych i magazynu. |
Odporność na uszkodzenia | Jeśli analiza danych musi być kontynuowana pomimo awarii składnika, musisz wybrać platformę odporną na błędy. |
Bezpieczeństwo | Większość organizacji oczekuje, że dane, z którymi pracują, będą bezpieczne w spoczynku i podczas przesyłania. Ważne jest również, aby prawie wszystkie organizacje spełniały standardy zgodności dla instytucji rządowych. |
Stosowanie kryteriów
Zastanów się, jak organizacja chce pracować z danymi big data. Teraz zastosuj kryteria podejmowania decyzji, aby określić, czy usługa HDInsight jest dobrym wyborem:
Zakres obciążeń: usługa HDInsight umożliwia obsługę wielu różnych obciążeń. Te obciążenia mogą być przetwarzaniem danych wsadowych, pracą z danymi przesyłanymi strumieniowo lub zarządzaniem magazynami danych i/lub obciążeniami nauki o danych. Ta funkcja sprawia, że usługa HDInsight jest atrakcyjnym wyborem, zwłaszcza jeśli proces biznesowy zawiera wiele obciążeń.
Skalowalność: usługa HDInsight obsługuje niezależne skalowalne zasoby obliczeniowe i magazyn. Ponadto węzły procesu roboczego mogą być skalowane automatycznie na podstawie obciążenia lub harmonogramu.
Napiwek
Znaczne optymalizacje kosztów mogą wynikać z oddzielenia zasobów obliczeniowych i magazynu oraz automatycznego skalowania klastra.
Odporność na uszkodzenia: węzły główne usługi HDInsight są odporne na awarie i wspierane przez maszyny wirtualne odporne na błędy. Dzięki temu usługa o wysokiej dostępności ma umowę SLA na poziomie 99,9%.
Zabezpieczenia: integracja firmy Microsoft Entra zapewnia uwierzytelnianie i autoryzację zabezpieczeń przedsiębiorstwa. Te możliwości oprócz obsługi szyfrowania i sieci wirtualnej zapewniają szczegółową kontrolę nad osobami, które mogą uzyskiwać dostęp do danych.
Podsumowując, rozważ użycie usługi HDInsight, jeśli chcesz:
Zbierz ogromne ilości danych na dużą skalę i:
- Uzyskiwanie szczegółowych informacji w czasie rzeczywistym.
- Przetwarzanie danych przy użyciu zoptymalizowanych kosztów, minimalnego nakładu pracy i silnych zabezpieczeń.
Migracja:
- Lokalne oprogramowanie typu open source, spakowane przez dostawcę dystrybucję Hadoop do chmury z jak najmniejszym kosztem i nakładem pracy.
- Oprogramowanie typu open source, usługa danych big data od konkurencyjnej oferty chmury do platformy Azure.