Descripción del problema empresarial
Proseware es una pequeña start-up que tiene como objetivo mejorar la asistencia sanitaria. Un equipo de Proseware está trabajando en una nueva aplicación web que ayudará a los profesionales de la salud a diagnosticar pacientes más rápidamente. La investigación ha demostrado que la diabetes es uno de los diagnósticos comunes y fáciles de detectar cuando un determinado patrón en los datos médicos de un paciente es evidente.
Para iniciar la nueva aplicación web para profesionales de la salud que les ayudará a diagnosticar pacientes, la primera característica que se va a implantar en la aplicación es un detector de diabetes. La característica permitirá que un profesional recopile datos médicos de un paciente, los rellene en la aplicación y determine si hay una alta probabilidad de que ese paciente tenga diabetes sí o no. Los profesionales sanitarios usarán esa información con sus conocimientos para dar consejos a sus pacientes sobre los pasos siguientes.
El equipo de ciencia de datos ha creado un modelo de clasificación que predice con precisión si alguien tiene diabetes o no basándose en datos anónimos. El entrenamiento del modelo se define en un cuaderno de Jupyter Notebook. Ahora es su tarea como ingeniero de aprendizaje automático tomar el trabajo del equipo de ciencia de datos y llevarlo a producción.
Para hacer operativo el modelo, deberá:
- Convertir el entrenamiento del modelo en una canalización sólida y reproducible.
- Probar el código y el modelo en un entorno de desarrollo.
- Implementar el modelo en un entorno de producción.
- Automatizar el proceso de un extremo a otro.
Aunque un cuaderno de Jupyter Notebook es ideal para experimentación, no es una buena opción para las cargas de trabajo de producción. La primera tarea consiste en convertir los cuadernos en scripts y ejecutar el entrenamiento del modelo como un trabajo de Azure Machine Learning, para que el flujo de trabajo se pueda desencadenar y automatizar fácilmente.