Cuándo usar HDInsight

Completado

La mayor fortaleza de HDInsight es el intervalo de configuraciones diferentes que ofrece el servicio. Permite admitir una amplia variedad de cargas de trabajo. Estas cargas de trabajo podrían ser el procesamiento por lotes de datos, el trabajo con datos de streaming o la administración de almacenamiento de datos o cargas de trabajo de ciencia de datos. Esta característica hace que HDInsight sea una opción atractiva, especialmente si el proceso empresarial contiene varias cargas de trabajo.

Por ejemplo, si su organización solo crea un almacenamiento de datos para presentar informes históricos mediante Power BI, puede ser práctico usar Azure SQL Data Warehouse con Power BI. Del mismo modo, si su organización realiza análisis avanzados con una solución de ciencia de datos y nada más, puede ser adecuado usar solo Azure Databricks.

Sin embargo, si las cargas de trabajo de su organización implican la ingesta de datos para los informes históricos y el análisis avanzado, y tiene datos de streaming que requieren análisis, HDInsight es una opción práctica. Todos los datos se pueden ingerir en una sola ubicación de Data Lake. Después, puede usar la configuración correcta de HDInsight para administrar el procesamiento por lotes, el almacenamiento de datos, las operaciones de ciencia de datos y las cargas de trabajo de streaming. Como hay separación entre el proceso y el almacenamiento, esto se puede hacer sin problemas sobre los mismos datos. Además, así minimizará el costo del almacenamiento, ya que las operaciones se realizan en un único almacén de datos.

Factores diferenciadores de HDInsight

Aparte de los escenarios descritos anteriormente, hay otros factores diferenciadores clave que hacen que HDInsight sea ideal para cargas de trabajo de macrodatos. Dichos factores son los siguientes:

  • Proceso y almacenamiento escalables de forma independiente
  • Escalado automático de nodos de trabajo en función de la carga de trabajo o la programación
  • Flexibilidad y tolerancia a errores de los nodos maestros
  • Seguridad de la empresa
  • SDK

La separación del proceso y el almacenamiento, junto con el escalado automático de clústeres en función de la carga de trabajo o la programación, puede conducir a optimizaciones de costos significativas. Los nodos maestros de HDInsight son resistentes a los errores. Los nodos maestros cuentan con el respaldo de máquinas virtuales tolerantes a errores que conducen a un servicio de alta disponibilidad con un contrato de nivel de servicio del 99,9 %. La integración de Microsoft Entra ofrece las funcionalidades de seguridad empresarial de autenticación y autorización. Estas funcionalidades, junto con el cifrado y la compatibilidad con redes virtuales, proporcionan un control granular de quién puede acceder a los datos. HDInsight cuenta con el respaldo de una gran variedad de SDK, que permiten la creación y el desarrollo de clústeres en varios idiomas en diversos IDE.