Cortana Analytics Suite
En la pasada AzureCon de la que hicimos un resumen hace poco, entre otras cosas se habló de Cortana Analytics Suite.
Cortana Analytics Suite engloba un conjunto de servicios PaaS (Platform as a Service) que pertenecen a las familias de Análisis e IoT, y almacenamiento de datos. Nace de la necesidad de los usuarios de obtener más y más valor de todos los datos que recopilan, y poder hacer uso de ellos para tomar decisiones que pueden acarrear consecuencias importantes, como pueden ser decisiones financieras, detección de fraude o ventas de un determinado producto.
Ilustración 1: Servicios de Cortana Analytics Suite
Pasar de un conjunto de datos a empezar a realizar una acción basada en dichos datos no es tarea sencilla. Se debe coger ese conjunto, realizar un reporte de estadísticas, agrupar a un conjunto de personas que analicen dichas estadísticas y finalmente proceder a realizar las acciones. Esas acciones producirán nuevos datos, que habrá que volver a analizar para tomar nuevas decisiones. Es un proceso largo y tedioso, que puede extenderse por semanas o incluso meses.
Cortana Analytics Suite tiene como propósito automatizar el proceso que va desde el análisis de datos a la acción. A través de un proceso de aprendizaje, se puede conseguir predecir qué resultados provocan ciertas acciones. Cuánto más largo sea este proceso, más óptimas serán las decisiones que se tomen de manera casi automática.
Ilustración 2: Procesos de Cortana Analytics Suite
Para lograr un sistema así, se deben conectar las fuentes de información, como las aplicaciones de nuestro negocio y los sensores y dispositivos. Todo ello producirá una cantidad ingente de datos que habrá que procesar posteriormente.
Estos datos pasan por varias fases:
Administración de la información
Es necesario organizar toda la información disponible que llegan desde todas las fuentes. Servicios como Azure Data Catalog tienen la capacidad de descubrir todas estas fuentes de datos e indexarlas, para encontrar los datos rápidamente. Azure Event Hubs, por su parte, permite introducir datos generados por eventos a Azure. Por último, Azure Data Factory permite orquestar toda la información.
Almacenamiento de la información
Debemos almacenar toda la información generada. Azure dispone de diversos servicios para almacenar datos, pero para el propósito de Cortana Analytics Suite se utilizan dos: Azure Data Lake y Azure SQL Data Warehouse. El primero de ellos es un servicio que permite almacenar volúmenes de datos del orden de petabytes y realizar grandes cantidades de operaciones de entrada/salida. El segundo es un almacén de datos que permite realizar queries sobre estos datos de manera flexible, es decir, podemos tener los datos almacenados y procesarlos solamente una vez a la semana o diariamente, según nuestras necesidades.
Machine learning y análisis:
Por último, se realiza el análisis de datos y las predicciones de las posibles situaciones que pueden darse. Para ello se utiliza Azure HDInsight, que es el servicio de Hadoop que ofrece Azure para analizar datos; Azure Stream Analytics que permite realizar trabajos de análisis utilizando lenguaje de consulta; y por último Azure Machine Learning, un servicio que utiliza modelos predictivos que aprenden de los datos existentes para predecir futuros comportamientos.
Tras todo el proceso se pasa a entregar la información al usuario final de una forma personalizada y entendible, de manera que pueda interactuar con ella. Se pueden utilizar servicios como PowerBI para poder ver una representación de todos los datos que hay almacenados. Y, gracias a Cortana, el usuario puede interactuar con el sistema de una manera natural, hablando al sistema como si lo estuviese haciendo para realizar acciones en su propio teléfono o PC.
Daniel Escribano García
Technical Evangelist Intern
@daesgar90