Usos de Azure HDInsight
Puede usar HDInsight para procesar los macrodatos en muchos escenarios mediante datos históricos o en tiempo real. Pero, ¿debería hacerlo? La mayor fortaleza de HDInsight es la amplia gama de configuraciones que ofrece. En esta unidad, considerará si HDInsight es la opción correcta para su organización. Analizará los siguientes criterios para ayudarle a decidir:
- Variedad de cargas de trabajo
- Escalabilidad
- Tolerancia a errores
- Seguridad
Criterios de decisión
Para determinar si HDInsight puede satisfacer las necesidades de macrodatos de su organización, use los criterios descritos en la tabla siguiente:
Criterios | Análisis |
---|---|
Variedad de cargas de trabajo | Si requiere compatibilidad con varias cargas de trabajo, necesitará una plataforma que pueda admitir esos requisitos. |
Escalabilidad | ¿Su organización necesita escalar para adaptarse a los aumentos en el volumen de datos y la velocidad de los datos? Es importante elegir una plataforma que se pueda escalar automáticamente y que admita el escalado de proceso y de almacenamiento de forma independiente. |
Tolerancia a errores | Si el análisis de datos debe continuar a pesar de los errores de los componentes, deberá elegir una plataforma tolerante a errores. |
Seguridad | La mayoría de las organizaciones esperan que los datos con los que trabajan sean seguros en reposo y en tránsito. También es importante que casi todas las organizaciones cumplan los estándares de cumplimiento de la administración. |
Aplicación de los criterios
Tenga en cuenta cómo quiere trabajar su organización con los macrodatos. Ahora aplique los criterios de decisión para determinar si HDInsight es una buena opción:
Intervalo de cargas de trabajo: HDInsight permite admitir una amplia variedad de cargas de trabajo. Estas cargas de trabajo podrían ser el procesamiento por lotes de datos, el trabajo con datos de streaming o la administración de almacenamiento de datos o cargas de trabajo de ciencia de datos. Esta característica hace que HDInsight sea una opción atractiva, especialmente si el proceso empresarial contiene varias cargas de trabajo.
Escalabilidad: HDInsight admite procesos y almacenamiento escalables de forma independiente. Además, los nodos de trabajo pueden escalar automáticamente en función de la carga de trabajo o la programación.
Sugerencia
Las optimizaciones de costos significativas pueden ser el resultado de separar el proceso y el almacenamiento y tener escalado automático de clústeres.
Tolerancia a errores: los nodos principales de HDInsight son resistentes a errores y están respaldados por máquinas virtuales tolerantes a errores. Esto lo convierte en un servicio de alta disponibilidad que tiene un Acuerdo de Nivel de Servicio del 99,9 %.
Seguridad: La integración de Microsoft Entra ofrece autenticación y autorización de seguridad empresarial. Estas funcionalidades, junto con el cifrado y la compatibilidad con redes virtuales, proporcionan un control granular sobre quién puede acceder a los datos.
En resumen, considere la posibilidad de usar HDInsight cuando quiera:
Recopilar grandes cantidades de datos a escala y:
- Obtener información en tiempo real.
- Procesar los datos con costos optimizados, un esfuerzo mínimo y una seguridad sólida.
Migrar:
- A la nube una distribución de Hadoop, empaquetada por el proveedor, de software local de código abierto, con el menor costo y esfuerzo posible.
- A Azure un servicio de macrodatos de software de código abierto de una oferta en la nube de la competencia.