Когда следует использовать Azure HDInsight

Завершено

HDInsight можно использовать для обработки больших данных во многих сценариях, используя исторические или данные в режиме реального времени; но ты? Самое важное преимущество HDInsight — это обширный предоставляемых конфигураций. В этом уроке вы узнаете, является ли HDInsight подходящим выбором для вашей организации. Вы проанализируете приведенные ниже критерии, что поможет вам принять решение:

  • Диапазон рабочих нагрузок
  • Масштабируемость
  • Отказоустойчивость
  • Безопасность

Условия принятия решений

Чтобы определить, может ли HDInsight соответствовать потребностям больших данных организации, используйте критерии, описанные в следующей таблице:

Критерии Анализ
Диапазон рабочих нагрузок Если вам нужна поддержка различных рабочих нагрузок, вам потребуется платформа, которая может поддерживать эти требования.
Масштабируемость Необходимо ли вашей организации масштабироваться в соответствии с ростом объема и скорости передачи данных? Важно выбрать платформу, способную автоматически масштабироваться и поддерживающую независимое масштабирование вычислений и хранилища.
Отказоустойчивость Если анализ данных должен продолжаться, несмотря на сбой компонентов, потребуется выбрать отказоустойчивую платформу.
Безопасность Большинству организаций требуется, чтобы данные, с которыми они работают, были защищены как при хранении, так и при передаче. Кроме того, почти всем организациям важно выполнять требования государственных стандартов соответствия.

Применение критериев

Подумайте, как именно ваша организация хочет работать с большими данными. А потом примените критерии для принятия решений, чтобы определить, является ли HDInsight подходящим выбором:

  • Диапазон рабочих нагрузок: HDInsight позволяет поддерживать широкий спектр рабочих нагрузок. Эти рабочие нагрузки могут включать пакетную обработку данных, работу с потоковой передачей данных или управление хранилищами данных и (или) рабочие нагрузки обработки и анализа данных. Эта функция делает HDInsight оптимальным выбором, особенно если бизнес-процесс содержит несколько рабочих нагрузок.

  • Масштабируемость: HDInsight поддерживает независимо масштабируемые вычислительные ресурсы и хранилище. Кроме того, рабочие узлы могут автоматически масштабироваться на основе рабочей нагрузки или расписания.

    Совет

    Значительная оптимизация затрат может повлечь за собой разделение вычислений и хранилища и привести к автоматическому масштабированию кластера.

  • Отказоустойчивость: головные узлы HDInsight устойчивы к сбоям и поддерживаются отказоустойчивыми виртуальными машинами. Это делает эту службу высокодоступной с соглашением об уровне обслуживания 99,9 %.

  • Безопасность: интеграция Microsoft Entra обеспечивает корпоративную проверку подлинности и авторизацию. Эти возможности наряду с поддержкой шифрования и виртуальных сетей позволяют детально настроить, кто может получить доступ к вашим данным.

Таким образом, вам рекомендуется использовать HDInsight при наличии следующих потребностей:

  • Сбор больших объемов данных в требуемом масштабе и:

    • Получение аналитических сведений в режиме реального времени.
    • Обработка данных с оптимизированными затратами, минимальными усилиями и высоким уровнем безопасности.
  • Миграция.

    • Упакованного поставщиком дистрибутива Hadoop в виде локального программного обеспечения с открытым кодом в облако с минимальными затратами и усилиями.
    • Программное обеспечение с открытым исходным кодом, служба больших данных из облака конкурентов в Azure.