Comprendre le problème de l’entreprise

Effectué

Imaginez que vous êtes ingénieur Machine Learning chez Proseware, une jeune start-up qui travaille sur une nouvelle application de soins de santé. Le modèle de classification du diabète, créé par les scientifiques des données, est le premier modèle à intégrer à l’application. Après avoir discuté avec toute l’équipe, il s’avère que l’objectif est d’intégrer plusieurs modèles à l’application web.

Une fois que le modèle de classification du diabète a montré ses preuves, Proseware veut ajouter d’autres modèles Machine Learning afin que les praticiens puissent diagnostiquer plus rapidement diverses maladies chez leurs patients. L’équipe de science des données doit être en mesure d’expérimenter chaque nouveau modèle dans un environnement sûr. Une fois que le nouveau modèle est suffisamment juste pour être intégré à l’application web, il doit encore être testé avant son déploiement sur un point de terminaison appelé à partir de l’application web.

Ensemble avec l’équipe, vous décidez qu’il est préférable d’utiliser des environnements différents :

  • Développement pour l’expérimentation.
  • Préproduction pour les tests.
  • Production pour le déploiement du modèle sur le point de terminaison de production.

Pour chaque environnement, vous allez créer un espace de travail Azure Machine Learning distinct. La séparation des espaces de travail pour chaque environnement vous permet de protéger les données et les ressources. Par exemple, l’espace de travail de développement ne contiendra pas de données personnelles des patients. Quant aux scientifiques des données, ils auront uniquement accès à l’espace de travail de développement, car ils n’ont besoin que d’un environnement d’expérimentation et n’ont pas besoin d’accéder au code ni aux ressources de production.

En tant qu’ingénieur Machine Learning, vous devez vous assurer que tout ce que les scientifiques des données créeront sera facilement déplaçable d’un environnement à un autre. Une fois qu’un nouveau modèle est prêt à être déployé, vous souhaitez que le modèle soit entraîné et testé dans l’environnement de préproduction. Après avoir testé le code, le modèle et le déploiement, vous souhaitez déployer le modèle dans l’environnement de production. Certaines étapes de ce processus peuvent être automatisées pour accélérer le processus.

Pour utiliser des environnements, vous allez :

  • Créer les environnements dans votre dépôt GitHub.
  • Stocker les informations d’identification dans chaque espace de travail Azure Machine Learning sous forme de secret d’environnement dans GitHub.
  • Ajouter les réviseurs nécessaires aux environnements pour l’approbation contrôlée.
  • Utiliser les environnements dans vos workflows GitHub Actions.