Definición de los flujos de datos
Un flujo de datos consta de una serie perpetua de datos, normalmente relacionados con eventos específicos en un momento dado. Por ejemplo, un flujo de datos puede contener detalles de los mensajes enviados a un sitio de micro-blogging de redes sociales o una serie de medidas medioambientales que registra un sensor meteorológico conectado a Internet. El análisis de datos de streaming se usa con más frecuencia para comprender mejor el cambio que se produce a lo largo del tiempo. Por ejemplo, una organización de marketing puede realizar análisis de sentimiento en mensajes de redes sociales para ver si una campaña publicitaria tiene como resultado comentarios más positivos sobre la empresa o sus productos, o bien una empresa agrícola podría supervisar las tendencias de temperatura y lluvia para optimizar el riego y la cosecha de cultivos.
Entre los objetivos comunes de Stream Analytics se incluyen los siguientes
- Analizar continuamente los datos para notificar problemas o tendencias.
- Describir el comportamiento del componente o del sistema bajo varias condiciones para ayudar a planear futuras mejoras.
- Desencadenar acciones o alertas específicas cuando se producen determinados eventos o se superan ciertos umbrales.
Características de las soluciones de procesamiento de flujos
Las soluciones de procesamiento de flujos suelen mostrar las características siguientes:
- El flujo de datos de origen no está enlazado: los datos se agregan al flujo de forma perpetua.
- Cada registro de datos del flujo incluye datos temporales (basados en el tiempo) que indican cuándo se ha producido el evento al que se relaciona el registro (o cuándo se ha registrado).
- La agregación de datos de streaming se realiza mediante ventanas temporales; por ejemplo, registrando el número de publicaciones en redes sociales por minuto o la lluvia media registrada por hora.
- Los resultados del procesamiento de datos de streaming se pueden usar para admitir la automatización o visualización en tiempo real (o casi en tiempo real), o bien se conservan en un almacén analítico a fin de combinarse con otros datos para el análisis histórico. Muchas soluciones combinan estos enfoques para admitir los análisis históricos y en tiempo real.