Contrôle des connaissances
Notes
Pour effectuer cet exercice, lisez l’étude de cas. À la fin, vous êtes invité à donner des conseils en répondant aux questions de contrôle des connaissances.
Bienvenue dans Proseware ! Vous avez été embauché comme scientifique des données en chef pour nous aider à concevoir une solution de déploiement de machine learning.
Comprendre le problème
Chez Proseware, nous développons une application mobile pour aider les médecins à diagnostiquer plus rapidement les maladies chez les patients. Le médecin peut entrer les données médicales du patient dans l’application pour obtenir un diagnostic sur le patient.
La première fonctionnalité que nous avons prévue permet à l’application d’indiquer au médecin s’il faut rechercher des signes de diabète chez le patient ou lui donner un traitement contre le diabète.
Nous avons déjà collecté des données corrélées avec le diabète, comme le nombre de grossesses, l’âge et l’indice de masse corporelle (IMC). Nous avons également une équipe de scientifiques des données qui travaillent à l’entraînement d’un modèle capable de déterminer si un patient est susceptible d’avoir du diabète.
Nous avons besoin de votre aide pour décider comment concevoir pour mettre le modèle en production.
Nous attendons avec impatience vos conseils sur la conception de la solution d’opérations d’apprentissage automatique (MLOps) !
Tenez compte des exigences
- Tenez compte des environnements. Actuellement, nous travaillons dans une petite équipe et vous êtes le seul scientifique des données impliqué. Nous voulons voir si ce projet réussit avant d’effectuer un scale-up et d’impliquer une grande équipe.
- Considérons le modèle. Comme le modèle est utilisé pour aider les médecins, la précision est importante pour nous. Le modèle ne doit être utilisé que lorsque nous savons qu’il fonctionne comme prévu.
- Tenez compte des données. Nous commençons petit et utiliserons principalement le modèle déployé pour tester notre application. Les données sur lesquelles le modèle déployé génère des prédictions ne doivent pas être utilisées pour réentraîner le modèle, car elles peuvent être biaisées.