Exploración de la arquitectura de la solución
Es importante comprender la imagen general antes de avanzar con la implementación para asegurarse de que se cumplen todos los requisitos. También queremos asegurarnos de que el enfoque se pueda adaptar fácilmente en el futuro. El objetivo de este ejercicio es empezar a usar Acciones de GitHub como herramienta de orquestación y automatización para la estrategia de operaciones de aprendizaje automático (MLOps) definida en la arquitectura de la solución.
Nota
El diagrama es una representación simplificada de una arquitectura de MLOps. Para ver una arquitectura más detallada, explore los distintos casos de uso del acelerador de soluciones MLOps (v2).
La arquitectura incluye:
- Configuración: creación de todos los recursos de Azure necesarios para la solución.
- Desarrollo de modelos (bucle interno): análisis y procesamiento de los datos para entrenar y evaluar el modelo.
- Integración continua: empaquetado y registro del modelo.
- Implementación de modelos (bucle externo): implementación del modelo.
- Implementación continua: prueba del modelo y promoción al entorno de producción.
- Supervisión: supervisión del rendimiento del modelo y del punto de conexión.
En concreto, vamos a automatizar la parte de entrenamiento del desarrollo del modelo, o bucle interno, lo que nos permitirá entrenar y registrar rápidamente varios modelos para la implementación en entornos de ensayo y producción.
El equipo de infraestructura ha creado el área de trabajo de Azure Machine Learning, el proceso de Azure Machine Learning y el repositorio de GitHub.
Además, el código para entrenar el modelo de clasificación está listo para producción y los datos necesarios para entrenar el modelo están disponibles en una instancia de Azure Blob Storage conectada al área de trabajo de Azure Machine Learning.
La implementación permitirá que el traslado del bucle interno al externo sea un proceso automatizado que se produzca cada vez que un científico de datos inserte código nuevo del modelo en el repositorio de GitHub, lo que permite la entrega continua de modelos de aprendizaje automático a los consumidores de nivel inferior del modelo, como la aplicación web que usará el modelo de clasificación de la diabetes.