Fase de implementación del ciclo de vida del proceso de ciencia de datos en equipos
En este artículo se describen los objetivos, las tareas y los resultados asociados a la implementación del Proceso de ciencia de datos en equipo (TDSP). Este proceso proporciona un ciclo de vida recomendado que el equipo puede usar para estructurar los proyectos de ciencia de datos. El ciclo de vida describe las fases principales que realiza el equipo, a menudo iterativamente:
- Conocimiento del negocio
- Adquisición y comprensión de los datos
- Modelado
- Implementación
- Aceptación del cliente
Esta es una representación visual del ciclo de vida de TDSP:
Objetivo
El objetivo de la etapa de implementación es implementar modelos con una canalización de datos en un entorno de producción o similar al de producción para la aceptación del cliente final.
Cómo completar la tarea
La tarea principal de esta fase es poner en funcionamiento el modelo. implemente el modelo y la canalización en un entorno de producción o semejante para el consumo de aplicaciones.
Uso de modelos
Cuando ya disponga de un conjunto de modelos que funcionen bien, el equipo los puede poner en funcionamiento para que los consuman otras aplicaciones. Dependiendo de los requisitos empresariales, se realizan predicciones en tiempo real o por lotes. Para implementar modelos, los expone con una interfaz de API. La interfaz permite a los usuarios consumir fácilmente el modelo en diferentes aplicaciones, como las siguientes:
- Sitios web
- Hojas de cálculo
- Paneles
- Aplicaciones de línea de negocio
- Aplicaciones de back-end
Para obtener ejemplos de operacionalización de modelos Azure Machine Learning, consulte Implementación de modelos de aprendizaje automático en Azure. Es un procedimiento recomendado crear la supervisión en el modelo de producción y la canalización de datos que se implementan. Este procedimiento ayuda con las posteriores tareas de solución de problemas e informes de estado del sistema.
Integración con MLflow
Para ayudar a admitir esta fase, puede incorporar las siguientes características de Azure Machine Learning:
Administración de modelos: para preparar una implementación, coloque un modelo en un entorno operativo o de producción. MLflow administra y versiona los modelos listos para la implementación, lo que ayuda a mejorar la puesta en funcionamiento.
Servicio e implementación de modelos: las funcionalidades de servicio del modelo de MLflow facilitan el proceso de implementación, por lo que puede servir fácilmente modelos en varios entornos.
Artifacts
En esta fase, el equipo entrega lo siguiente:
Un panel de estado que muestra el estado del sistema y métricas clave. Se recomienda usar Power BI para crear un panel.
Un informe de modelado final con detalles de la implementación.
Un documento de arquitectura de la solución final.
Documentación revisada por expertos
Los investigadores publican estudios sobre el TDSP en la documentación revisada por expertos. Las citas proporcionan una oportunidad para investigar otras aplicaciones o ideas similares al TDSP, incluida la fase del ciclo de vida de implementación.
Colaboradores
Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.
Autor principal:
- Mark Tabladillo | Arquitecto sénior de soluciones en la nube
Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.
Recursos relacionados
En estos artículos se describen las demás fases del ciclo de vida del TDSP: