Créer des modèles d’IA personnalisés avec Azure Machine Learning

Effectué

La disponibilité de modèles IA sophistiqués peut aider les entreprises à réduire considérablement la quantité de ressources qu’un projet de science des données peut nécessiter. Voyons comment les entreprises peuvent relever les défis et les opérations de Machine Learning avec Azure Machine Learning.

Défis du Machine Learning et besoin des opérations de Machine Learning

La gestion des solutions IA nécessite généralement la gestion du cycle de vie du Machine Learning pour documenter et gérer les données, le code, les environnements de modèle et les modèles Machine Learning eux-mêmes. Vous devez établir des processus de développement, d’empaquetage et de déploiement des modèles ainsi qu’analyser leur niveau de performance et occasionnellement effectuer un nouvel apprentissage. En outre, la plupart des organisations gèrent plusieurs modèles en production en même temps, ce qui ajoute à la complexité.

Pour faire face efficacement à cette complexité, certaines meilleures pratiques sont nécessaires. Elles se concentrent sur la collaboration inter-équipes, l’automatisation et la normalisation des processus et la garantie que les modèles peuvent être facilement audités, expliqués et réutilisés. Pour ce faire, les équipes de science des données s’appuient sur l’approche des opérations de Machine Learning. Cette méthodologie s’inspire de DevOps (développement et opérations), la norme du secteur pour la gestion des opérations pour un cycle de développement d’applications, car les difficultés des développeurs et des scientifiques des données sont similaires.

Azure Machine Learning

Les scientifiques des données peuvent gérer et exécuter le DevOps d’apprentissage automatique à partir de Azure Machine Learning, une plateforme de Microsoft pour faciliter la gestion du cycle de vie et les pratiques opérationnelles d’apprentissage automatique. Ces outils aident les équipes à collaborer dans un environnement partagé, auditable et sécurisé où de nombreux processus peuvent être optimisés via l’automatisation.

Capture d’écran de la page d’accueil d’Azure Machine Learning Studio.

Gestion du cycle de vie Machine Learning

Azure Machine Learning prend en charge la gestion du cycle de vie d’apprentissage automatique des modèles pré-entraînés et personnalisés de bout en bout. Le cycle de vie classique comprend les étapes suivantes : préparation des données, entraînement de modèle, empaquetage de modèles, validation de modèle, déploiement de modèle, surveillance et ré-entraînement des modèles.

Diagramme illustrant le cycle de vie du ML : préparation des données, entraînement du modèle, conditionnement du modèle, validation du modèle, déploiement du modèle, surveillance du modèle et réentraînement du modèle.

L’approche classique couvre toutes les étapes habituelles d’un projet de science des données.

  1. Préparer le jeu de données. L’IA commence au niveau des données. Tout d’abord, les scientifiques des données doivent préparer les données avec lesquelles effectuer l’apprentissage du modèle. La préparation des données est souvent le plus gros investissement en temps du cycle de vie. Cette tâche implique de rechercher ou de créer votre propre jeu de données et de le nettoyer afin qu’il soit facilement lisible par les machines. Vous souhaitez vous assurer que les données sont un échantillon représentatif, que vos variables sont pertinentes pour votre objectif, et ainsi de suite.
  2. Effectuer l’apprentissage et tester. Ensuite, les scientifiques des données appliquent des algorithmes aux données pour effectuer l'apprentissage d’un modèle Machine Learning. Ils le testent alors avec de nouvelles données pour déterminer la précision de ses prédictions.
  3. Package. Un modèle ne peut pas être directement placé dans une application. Il doit être conteneurisé, afin de pouvoir fonctionner avec tous les outils et frameworks sur lesquels il est construit.
  4. Validez. À ce stade, l’équipe évalue les performances du modèle relativement aux objectifs métier. Les tests peuvent retourner des mesures suffisamment bonnes, mais le modèle peut ne pas fonctionner comme prévu lorsqu’il est utilisé dans un scénario métier réel.
    • Répéter les étapes 1 à 4. Des centaines d’heures d’entraînement peuvent être nécessaires pour trouver un modèle satisfaisant. L’équipe de développement peut entraîner de nombreuses versions du modèle en ajustant les données d’entraînement, en optimisant les hyperparamètres de l’algorithme ou en essayant des algorithmes différents. Dans l’idéal, le modèle s’améliore avec chaque séquence d’ajustement. Au final, c’est le rôle de l’équipe de développement de déterminer la version du modèle qui correspond le mieux au cas d’usage métier.
  5. Déployer. Enfin, ils déploient le modèle. Les options de déploiement sont les suivantes : dans le cloud, sur un serveur local et sur des appareils tels que des caméras, des passerelles IoT ou des machines.
  6. Analyser et effectuer un nouvel apprentissage. Même si un modèle fonctionne bien initialement, il doit être supervisé et réentraîné continuellement pour rester pertinent et précis.

Remarque

L’intégration de modèles pré-entraînés et leur adaptation aux besoins de votre entreprise nécessite un flux de travail différent qui intègre des modèles personnalisés. Avec Azure Machine Learning, vous pouvez utiliser des modèles pré-entraînés ou créer vos propres modèles. Le choix d’une approche sur une autre dépend du scénario. L’utilisation de modèles pré-entraînés présente l’avantage d’exiger moins de ressources et de fournir des résultats plus rapidement. Toutefois, les modèles prédéfinis sont formés pour résoudre un large éventail de cas d’usage, de sorte qu’ils peuvent avoir du mal à répondre à des besoins très spécifiques. Dans ce cas, un modèle personnalisé complet peut être une meilleure idée. Une combinaison flexible des deux approches est souvent préférable et facilite la mise à l’échelle. Les équipes IA peuvent économiser des ressources à l’aide de modèles pré-entraînés aux cas d’usage les plus simples, tout en investissant ces ressources dans la création de modèles IA personnalisés pour les scénarios les plus difficiles. D’autres itérations peuvent améliorer les modèles prédéfinis en en effectuant un nouvel apprentissage.

Opérations de Machine Learning

Les opérations d’apprentissage automatique (MLOps) appliquent la méthodologie DevOps (développement et opérations) pour gérer le cycle de vie d’apprentissage automatique plus efficacement. Il permet une collaboration plus agile et productive dans les équipes IA de toutes les parties prenantes. Ces collaborations impliquent des scientifiques des données, des ingénieurs IA, des développeurs d’applications et d’autres équipes informatiques.

Les processus et les outils MLOps aident ces équipes à collaborer et à fournir une visibilité via une documentation partagée qui peut être auditée. Les technologies MLOps permettent aux utilisateurs d’enregistrer et de suivre les modifications apportées à toutes les ressources, telles que les données, le code, les modèles et d’autres outils. Ces technologies peuvent également apporter des gains d’efficacité et accélérer le cycle de vie avec une automatisation, des workflows reproductibles et des ressources réutilisables. Toutes ces pratiques rendent les projets d’IA plus agiles et plus efficaces.

Azure Machine Learning prend en charge les pratiques MLOps suivantes :

  • Reproductibilité du modèle : signifie que différents membres de l’équipe peuvent exécuter des modèles sur le même jeu de données et obtenir des résultats similaires. La reproductibilité est essentielle pour rendre les résultats des modèles fiables en production. Azure Machine Learning prend en charge la reproductibilité des modèles avec des ressources de gestion centralisée telles que des environnements, du code, des jeux de données, des modèles et des pipelines d’apprentissage automatique.

  • Validation du modèle : avant le déploiement d’un modèle, il est essentiel de valider ses métriques de performances. Vous pouvez avoir plusieurs métriques utilisées pour indiquer le « meilleur » modèle. Il est essentiel de valider les métriques de performances de manière pertinente selon le cas d’usage métier. Azure Machine Learning prend en charge la validation des modèles grâce à de nombreux outils permettant d'évaluer leurs métriques, telles que les fonctions de perte et les matrices de confusion.

  • Déploiement du modèle : lorsqu’un modèle est déployé, il est important que les scientifiques des données et les ingénieurs IA travaillent ensemble pour déterminer la meilleure option de déploiement. Ces options comprennent le cloud, l’option locale et celle des appareils en périphérie (caméras, drones, machines).

  • Réentraînement du modèle: les modèles doivent être surveillés et régulièrement ré-entraînés pour corriger les problèmes de performances et tirer parti des données d’apprentissage plus récentes. Azure Machine Learning prend en charge un processus systématique et itératif pour affiner et garantir la précision du modèle.

Conseil

Photographie montrant un soignant accédant à Azure Machine Learning sur une tablette.
Témoignage client : Un organisme de santé utilise Azure Machine Learning pour entraîner des modèles d'apprentissage automatique personnalisés qui prédisent la probabilité de complications pendant les procédures chirurgicales. Les modèles sont entraînés sur d’énormes volumes de données, qui incluent des facteurs tels que l’âge, l’origine ethnique, les antécédents de tabagisme, l’index de masse corporelle et la numération plaquettaire. L’utilisation de ces modèles permet aux professionnels de santé de mieux évaluer les risques et de déterminer les options d’intervention chirurgicale ou les recommandations de changement de mode de vie pour chaque patient. Le tableau de bord d’IA responsable dans Azure Machine Learning permet d’expliquer les facteurs prédictifs et d’atténuer les biais provenant des facteurs démographiques. En fin de compte, la solution de modélisation prédictive permet de réduire les risques et l’incertitude, et d’améliorer les résultats des interventions chirurgicales. Lisez l’histoire complète du client ici : https://aka.ms/azure-ml-customer-story.

Conseil

Prenez un moment pour réfléchir à la façon dont votre entreprise peut tirer parti de la science des données et de l’expertise de l’apprentissage automatique pour créer des modèles personnalisés.
Photographie montrant des personnes travaillant et discutant autour d’une table.

Ensuite, terminons par un contrôle des connaissances.