Kiedy należy używać usługi Azure HDInsight

Ukończone

Usługi HDInsight można używać do przetwarzania danych big data w wielu scenariuszach, przy użyciu danych historycznych lub w czasie rzeczywistym; ale czy powinieneś? Największą siłą usługi HDInsight jest szeroki zakres dostępnych konfiguracji. W tej lekcji rozważysz, czy usługa HDInsight jest właściwym wyborem dla twojej organizacji. Przeanalizujesz następujące kryteria, aby ułatwić podjęcie decyzji:

  • Zakres obciążeń
  • Skalowalność
  • Odporność na uszkodzenia
  • Zabezpieczenia

Kryteria decyzji

Aby określić, czy usługa HDInsight może spełniać potrzeby organizacji w zakresie danych big data, należy użyć kryteriów opisanych w poniższej tabeli:

Kryteria Analiza
Zakres obciążeń Jeśli potrzebujesz obsługi różnych obciążeń, potrzebujesz platformy, która może obsługiwać te wymagania.
Skalowalność Czy twoja organizacja musi skalować w celu dostosowania się do wzrostu ilości danych i szybkości danych? Ważne jest, aby wybrać platformę, która może być skalowana automatycznie i obsługiwać niezależne skalowanie zasobów obliczeniowych i magazynu.
Odporność na uszkodzenia Jeśli analiza danych musi być kontynuowana pomimo awarii składnika, musisz wybrać platformę odporną na błędy.
Bezpieczeństwo Większość organizacji oczekuje, że dane, z którymi pracują, będą bezpieczne w spoczynku i podczas przesyłania. Ważne jest również, aby prawie wszystkie organizacje spełniały standardy zgodności dla instytucji rządowych.

Stosowanie kryteriów

Zastanów się, jak organizacja chce pracować z danymi big data. Teraz zastosuj kryteria podejmowania decyzji, aby określić, czy usługa HDInsight jest dobrym wyborem:

  • Zakres obciążeń: usługa HDInsight umożliwia obsługę wielu różnych obciążeń. Te obciążenia mogą być przetwarzaniem danych wsadowych, pracą z danymi przesyłanymi strumieniowo lub zarządzaniem magazynami danych i/lub obciążeniami nauki o danych. Ta funkcja sprawia, że usługa HDInsight jest atrakcyjnym wyborem, zwłaszcza jeśli proces biznesowy zawiera wiele obciążeń.

  • Skalowalność: usługa HDInsight obsługuje niezależne skalowalne zasoby obliczeniowe i magazyn. Ponadto węzły procesu roboczego mogą być skalowane automatycznie na podstawie obciążenia lub harmonogramu.

    Napiwek

    Znaczne optymalizacje kosztów mogą wynikać z oddzielenia zasobów obliczeniowych i magazynu oraz automatycznego skalowania klastra.

  • Odporność na uszkodzenia: węzły główne usługi HDInsight są odporne na awarie i wspierane przez maszyny wirtualne odporne na błędy. Dzięki temu usługa o wysokiej dostępności ma umowę SLA na poziomie 99,9%.

  • Zabezpieczenia: integracja firmy Microsoft Entra zapewnia uwierzytelnianie i autoryzację zabezpieczeń przedsiębiorstwa. Te możliwości oprócz obsługi szyfrowania i sieci wirtualnej zapewniają szczegółową kontrolę nad osobami, które mogą uzyskiwać dostęp do danych.

Podsumowując, rozważ użycie usługi HDInsight, jeśli chcesz:

  • Zbierz ogromne ilości danych na dużą skalę i:

    • Uzyskiwanie szczegółowych informacji w czasie rzeczywistym.
    • Przetwarzanie danych przy użyciu zoptymalizowanych kosztów, minimalnego nakładu pracy i silnych zabezpieczeń.
  • Migracja:

    • Lokalne oprogramowanie typu open source, spakowane przez dostawcę dystrybucję Hadoop do chmury z jak najmniejszym kosztem i nakładem pracy.
    • Oprogramowanie typu open source, usługa danych big data od konkurencyjnej oferty chmury do platformy Azure.