Azure Machine Learning
Machine learning (aprendizaje automático) es una rama de la inteligencia artificial basada en la elaboración de modelos predictivos. A partir de estos modelos y de datos existentes, se elabora una predicción sobre comportamientos futuros, resultados y tendencias. Esto permite añadir inteligencia a las aplicaciones y dispositivos, mejorando el servicio que ofrecen.
Azure Machine Learning es una herramienta de análisis predictivo basada en la nube que facilita la creación y despliegue de soluciones, ofreciendo un servicio para desplegar las soluciones como servicios web listos para ser consumidos. Azure Machine Learning proporciona una manera potente de hacer análisis predictivo. Permite utilizar librerías con algoritmos, crear modelos en un ordenador con conexión a internet sin necesidad de equipamiento adicional o infraestructura, y desplegar las soluciones de manera rápida. Existen también ejemplos ya preparados en el Azure Marketplace y Cortana Analytics Gallery.
Para la creación de modelos predictivos existe una herramienta colaborativa basada en drag and drop, Microsoft Azure Machine Learning Studio.
En el apartado de Studio, el menú de la izquierda podemos ver una serie de opciones:
- Experimentos: todos los experimentos que han sido creados y guardados como borradores.
- Web Services: servicios web que hayan sido desplegados a partir de los experimentos.
- Notebooks: Jupyter notebooks creados.
- Datasets: datasets subidos al estudio.
- Trained models: modelos que hayan sido entrenados en experimentos y almacenados en el estudio.
- Settings: ajustes para la configuración de la cuenta y los recursos.
El apartado Gallery lleva a Cortana Analytics Gallery donde desarrolladores y especialistas en análisis de datos comparten sus soluciones creadas usando componentes de la Cortana Analytics Suite.
Un experimento consiste en datasets que proporcionan datos para módulos de análisis que se conectan entre ellos para construir un modelo de análisis predictivo. Un experimento tiene las siguientes características:
- Tiene al menos un dataset y un módulo
- Los datasets se conectan únicamente con módulos
- Los módulos se conectan tanto con datasets como con otros módulos
- Todos los puertos de entrada a los módulos tienen que tener conexión con el flujo de datos
- Todos los parámetros requeridos para cada módulo han de estar establecidos
A continuación, vamos a ver los principales elementos de un modelo de análisis.
Un dataset es un conjunto de datos que han sido subidos al estudio para ser usados por los modelos. Hay una serie de datasets cargados por defecto en el estudio para poder hacer pruebas con ellos. Algunos de ellos son:
- Datos de consumo de combustible de automóviles
- Datos sobre cáncer de mama
- Datos sobre incendios forestales
Un módulo es un algoritmo que se puede aplicar sobre los datos. Machine Learning Studio tiene variedad de módulos desde ingesta de datos a entrenamiento, puntuación y validación de procesos. Algunos ejemplos de módulos son:
- Conversión a ARFF
- Estadísticas elementales
- Regresión lineal
- Score Model
Una vez creado el experimento ha de ser entrenado con datos. Se puede realizar el experimento con diferentes algoritmos para comparar y evaluar los resultados.
Cuando ya se ha entrenado el modelo, puede ser usado para predecir nuevos datos. Para poder hacer esto hay que convertir el experimento de aprendizaje en experimento predictivo. Una vez convertido ya está listo para ser desplegado como servicio web. Los usuarios enviarán datos al modelo y el modelo devolverá el resultado con la predicción.
El servicio web puede ser gestionado desde el portal de Azure en el apartado Machine Learning. Se puede monitorizar el servicio, actualizarlo y borrarlo.
Para más información y ejemplos de cómo hacer tu experimento puedes acceder aquí.
Beatriz García Roces
Technical Evangelist Intern
@BeRoces