La manera de analizar un escenario y asignarlo a una opción de configuración de HDInsight.

Completado

Lea el caso práctico siguiente y responda a las preguntas para asignar un escenario a una configuración de clúster de HDInsight.

Caso práctico: AdventureWorks Cycles

AdventureWorks vende bicicletas y repuestos directamente a clientes y distribuidores. La compañía tiene actualmente una sola oficina en los Países Bajos. Venden bicicletas en los Estados Unidos, Alemania y España mediante una cadena de distribuidores y de su sitio web. Para las entregas, recurren a centros de distribución locales.

La empresa tiene previsto establecer nuevas oficinas para expandirse, ya que las ventas en estos países o regiones han aumentado en los últimos tres años. Las ubicaciones son las siguientes:

  • Tokio, Japón
  • Seattle, Estados Unidos
  • Chicago, Estados Unidos
  • Berlín, Alemania
  • Barcelona, España
  • París, Francia

AdventureWorks lleva enfrentándose a un mercado muy competitivo los últimos 15 años. Aspira a convertirse en la compañía de bicicletas más innovadora ofreciendo a los propietarios de bicicletas actuales y futuros el mejor nivel de tecnología y servicios. Los miembros del departamento de investigación y desarrollo de AdventureWorks ha diseñado correctamente la siguiente generación de productos innovadores. Cuentan con la ayuda de ingenieros de datos, ingenieros de inteligencia artificial y científicos de datos para diseñar e implementar la solución.

Dado el aumento de las ventas y la expansión internacional, la infraestructura de datos existente no cumplirá los requisitos empresariales generales ni el crecimiento futuro al que aspira AdventureWorks. Los directores de información y tecnología han expresado su deseo de abandonar los sistemas locales existentes y pasar a la nube para adaptarse al crecimiento esperado. Este plan cuenta con el apoyo del director financiero, ya que se ha solicitado hardware de sustitución ante el inminente fin del ciclo de vida de la infraestructura existente. El director financiero es consciente de que la nube podría ofrecer alternativas más rentables.

Como ingeniero de datos sénior, ayudará a AdventureWorks en el diseño y la implementación de la solución. Esto ayudará a la empresa a cumplir los requisitos empresariales, funcionales y técnicos establecidos para las estrategias de crecimiento, expansión e innovación. Usted ejecutará este plan de forma que se minimicen los costos operativos y se pueda supervisar la eficacia.

En un taller de detección, descubre la información siguiente:

Análisis de datos

Los informes empresariales los facilita actualmente una sola base de datos local que está configurada como almacenamiento de datos. Contiene una base de datos denominada AdventureWorksDW, que se usa para proporcionar informes históricos y análisis descriptivos. Últimamente, a ese servidor le está costando procesar los datos de informes rápidamente, por eso su equipo debe asegurarse de que el acceso a los datos esté restringido.

Además, AdventureWorks también quiere llevar más allá el análisis de los datos y empezar a usar las capacidades de análisis predictivo. En la actualidad, esta actividad no se lleva a cabo. La organización entiende que se puede crear una recomendación o un motor de análisis de texto. Por eso, la empresa quiere que usted les oriente sobre cuál sería la mejor tecnología y el mejor enfoque para implementar una solución de este tipo que sea también resistente y eficaz.

Análisis de redes sociales

Durante los últimos años, el departamento de marketing de la organización ha llevado a cabo varias campañas en X en diferentes épocas del año. A los responsables les interesa medir el impacto de su trabajo mediante el seguimiento de recursos de las redes sociales, como los hashtags de las campañas. Les gustaría poder realizar un seguimiento de hashtags con cualquier tipo de nombre.

Bicicletas conectadas

Las bicicletas de AdventureWorks pueden estar equipadas con un innovador equipo informático integrado. Dicho equipo incluye características de bloqueo automático de la bicicleta, así como el estado operativo. Entre los datos que captura el equipo informático de la bicicleta se incluyen los siguientes:

  • Modelo de bicicleta, número de serie y propietario registrado
  • Ubicación de la bicicleta (latitud y longitud)
  • Estado actual (detenido o en movimiento)
  • Velocidad actual en kilómetros por hora
  • Bicicleta bloqueada o desbloqueada
  • Información sobre los repuestos y los componentes de la bicicleta (en el caso de las bicicletas eléctricas)

Las aplicaciones propias de la empresa y de terceros pueden tener acceso a la información del equipo de la bicicleta, que debe estar protegida. Estos datos se pueden usar para la integración en aplicaciones móviles, la visualización de la ubicación en tiempo real y la información sobre el uso compartido de las bicicletas. Además, los datos de resumen diarios se pueden guardar en archivos planos. Entre estos se incluyen el modelo de bicicleta, el número de serie, el propietario registrado, un resumen del kilometraje total por día y la velocidad media.

Servicios de mantenimiento de bicicletas

Los propietarios de las bicicletas pueden optar por recibir notificaciones en el momento en que sea necesario reparar la bicicleta, en función de lo siguiente:

  • Telemetría procedente de las bicicletas eléctricas, basada en datos del sensor.
  • Información sobre el uso de la bicicleta procedente del equipo informático integrado en la bicicleta, en función del promedio de kilometraje y desgaste.
  • Este escenario de mantenimiento predictivo es un servicio de pago al que pueden acceder los propietarios de las bicicletas.

Preguntas

En función de este caso práctico, responda a las preguntas siguientes:


Prueba de conocimientos

1.

¿Qué tipo de configuración de clúster de HDInsight sería adecuada para cumplir los requisitos de transmisión que se necesitan en el escenario de bicicletas conectadas?

2.

¿Qué tipo de configuración de clúster de HDInsight sería adecuada para hospedar el análisis de datos que realiza el almacenamiento de datos en el SQL Server local?

3.

¿Qué tipo de configuración de clúster de HDInsight sería adecuada para llevar a cabo el trabajo de mantenimiento predictivo en el servicio de mantenimiento de bicicletas?

4.

Para cumplir todos los escenarios descritos en las preguntas anteriores, ¿qué tipo de almacenamiento de datos se debe usar para administrar todas estas cargas de trabajo?