Когда следует использовать Azure HDInsight
HDInsight можно использовать для обработки больших данных во многих сценариях, используя исторические или данные в режиме реального времени; но ты? Самое важное преимущество HDInsight — это обширный предоставляемых конфигураций. В этом уроке вы узнаете, является ли HDInsight подходящим выбором для вашей организации. Вы проанализируете приведенные ниже критерии, что поможет вам принять решение:
- Диапазон рабочих нагрузок
- Масштабируемость
- Отказоустойчивость
- Безопасность
Условия принятия решений
Чтобы определить, может ли HDInsight соответствовать потребностям больших данных организации, используйте критерии, описанные в следующей таблице:
Критерии | Анализ |
---|---|
Диапазон рабочих нагрузок | Если вам нужна поддержка различных рабочих нагрузок, вам потребуется платформа, которая может поддерживать эти требования. |
Масштабируемость | Необходимо ли вашей организации масштабироваться в соответствии с ростом объема и скорости передачи данных? Важно выбрать платформу, способную автоматически масштабироваться и поддерживающую независимое масштабирование вычислений и хранилища. |
Отказоустойчивость | Если анализ данных должен продолжаться, несмотря на сбой компонентов, потребуется выбрать отказоустойчивую платформу. |
Безопасность | Большинству организаций требуется, чтобы данные, с которыми они работают, были защищены как при хранении, так и при передаче. Кроме того, почти всем организациям важно выполнять требования государственных стандартов соответствия. |
Применение критериев
Подумайте, как именно ваша организация хочет работать с большими данными. А потом примените критерии для принятия решений, чтобы определить, является ли HDInsight подходящим выбором:
Диапазон рабочих нагрузок: HDInsight позволяет поддерживать широкий спектр рабочих нагрузок. Эти рабочие нагрузки могут включать пакетную обработку данных, работу с потоковой передачей данных или управление хранилищами данных и (или) рабочие нагрузки обработки и анализа данных. Эта функция делает HDInsight оптимальным выбором, особенно если бизнес-процесс содержит несколько рабочих нагрузок.
Масштабируемость: HDInsight поддерживает независимо масштабируемые вычислительные ресурсы и хранилище. Кроме того, рабочие узлы могут автоматически масштабироваться на основе рабочей нагрузки или расписания.
Совет
Значительная оптимизация затрат может повлечь за собой разделение вычислений и хранилища и привести к автоматическому масштабированию кластера.
Отказоустойчивость: головные узлы HDInsight устойчивы к сбоям и поддерживаются отказоустойчивыми виртуальными машинами. Это делает эту службу высокодоступной с соглашением об уровне обслуживания 99,9 %.
Безопасность: интеграция Microsoft Entra обеспечивает корпоративную проверку подлинности и авторизацию. Эти возможности наряду с поддержкой шифрования и виртуальных сетей позволяют детально настроить, кто может получить доступ к вашим данным.
Таким образом, вам рекомендуется использовать HDInsight при наличии следующих потребностей:
Сбор больших объемов данных в требуемом масштабе и:
- Получение аналитических сведений в режиме реального времени.
- Обработка данных с оптимизированными затратами, минимальными усилиями и высоким уровнем безопасности.
Миграция.
- Упакованного поставщиком дистрибутива Hadoop в виде локального программного обеспечения с открытым кодом в облако с минимальными затратами и усилиями.
- Программное обеспечение с открытым исходным кодом, служба больших данных из облака конкурентов в Azure.