Comprendre le problème de l’entreprise
Imaginez que vous travaillez chez Proseware, une start-up qui s’est donné pour mission d’aider les praticiens du secteur de la santé à être plus performants dans leur travail. Pour aider les praticiens, une nouvelle application web est en cours de développement afin d’accélérer le diagnostic des patients en fonction des informations médicales disponibles.
Un modèle de classification du diabète est entraîné et prêt à être intégré à l’application web. L’un des principaux objectifs à long terme de Proseware est d’améliorer continuellement l’application et la précision du modèle à l’avenir.
Vous avez rejoint l’équipe en tant qu’ingénieur Machine Learning, et il vous a été demandé de normaliser l’intégration continue du modèle avec l’application. L’un des aspects importants de la normalisation est de garantir que le code utilisé pour entraîner le modèle est vérifié.
Pour vérifier le code utilisé pour entraîner le modèle de classification du diabète, vous devez exécuter :
- Un linting : vérification des erreurs de programmation ou stylistiques dans les scripts Python ou R.
- Des tests unitaires : vérification des performances du contenu du code.
Afin que l’équipe de science des données puisse mieux comprendre les normes de qualité du code, elle pourra vérifier son code lors du développement local dans Visual Studio Code.
Toutefois, vous souhaitez automatiser la vérification du code pour vérifier que tout le code poussé en production ne présente aucun problème et fonctionne comme prévu. Avec l’équipe de science des données, vous décidez d’exécuter des tests unitaires et un linting chaque fois qu’une demande de tirage est créée à l’aide de GitHub Actions.