Introducción

Completado

En la actualidad, muchas organizaciones trabajan con macrodatos. El gran volumen y variedad de datos, así como la velocidad de generación de datos, requieren disponer de sistemas que ayuden a su administración y control. En el pasado, las organizaciones usaban sistemas de administración de bases de datos relacionales para controlar los datos. Sin embargo, las organizaciones ahora quieren la funcionalidad de software de código abierto combinada con las ventajas de las plataformas hospedadas. Azure HDInsight es el ejemplo perfecto de esta asociación. HDInsight le permite procesar los macrodatos en muchos escenarios mediante datos históricos o en tiempo real.

En el gráfico siguiente se muestra información general sobre cómo puede usar HDInsight. Muestra varios orígenes de datos, incluidos sensores de Internet de las cosas (IoT), bases de datos y algunos almacenes de datos de Azure. HDInsight procesa los datos de estas ubicaciones. A continuación, los hace disponibles en el almacenamiento a largo plazo para aplicaciones en tiempo real y análisis adicionales.

Diagram of the architecture of HDInsight in a typical organization, depicting several data sources from which it manages big data.

Escenario de ejemplo

Imaginemos que trabaja para una organización que compila cargas de trabajo que ingieren datos para la elaboración de informes históricos y análisis avanzados. Quizás también tenga datos de streaming que requieran análisis. En esta situación, es posible que quiera considerar el uso de HDInsight. Permite la ingesta de todos los datos en una sola ubicación de Data Lake. Después, puede usarlo para administrar las cargas de trabajo siguientes:

  • Procesamiento por lotes
  • Almacenamiento de datos
  • Operaciones de ciencia de datos
  • Streaming

¿Qué hará?

Al final de este módulo, podrá evaluar si HDInsight puede ayudar a su organización a procesar los macrodatos. También podrá describir cómo HDInsight usa marcos de código abierto populares que admiten muchos escenarios de datos.

¿Cuál es el objetivo principal?

El objetivo principal es determinar si HDInsight es una opción adecuada para sus requisitos de procesamiento de macrodatos.