Comment utiliser un modèle
Passons en revue la façon dont ces composants s’imbriquent pour effectuer l’apprentissage d’un modèle.
Entraînement et utilisation d’un modèle
Il est important de faire la distinction entre la formation et l’utilisation d’un modèle.
Utiliser un modèle signifie fournir des entrées et recevoir une estimation ou une prédiction. Nous effectuons ce processus quand nous entraînons notre modèle, et quand nous ou nos clients l’utilisons en situation réelle. Utiliser un modèle prend normalement moins de quelques secondes.
En revanche, l’entraînement d’un modèle est le processus qui consiste à améliorer son fonctionnement. L’apprentissage nécessite l’utilisation du modèle, de la fonction objective et de l’optimiseur dans une boucle spéciale. L’entraînement peut prendre quelques minutes ou plusieurs jours. Habituellement, nous n’entraînons un modèle qu’une seule fois. Une fois qu’il est formé, nous pouvons l’utiliser autant de fois que nous le souhaitons sans apporter d’autres modifications.
Par exemple, dans notre scénario de magasin pour chiens d’avalanche, nous souhaitons effectuer l’apprentissage d’un modèle en utilisant un jeu de données public. Le jeu de données modifie le modèle pour qu’il puisse prédire la taille de bottes d’un chien en fonction de la taille de son harnais. Une fois notre modèle entraîné, nous l’utilisons dans le cadre de notre boutique en ligne pour avoir la certitude que les clients achètent des bottes pour chien ayant la taille appropriée.
Données pour l’utilisation, données pour l’entraînement
Rappelez-vous qu’un jeu de données est une collection d’informations sur des objets ou des choses. Par exemple, un jeu de données peut contenir des informations sur des chiens :
ID du chien | Taille de chaussures | Taille de harnais | Couleur du chien | Breed (Race) |
---|---|---|---|---|
0 | 27 | 12 | Brown | St Bernard |
1 | 26 | 11 | Noir | Labrador |
2 | 25 | 10 | White | Labrador |
3 | 29 | 14 | Noir | Berger allemand noir |
Quand nous utilisons notre modèle, nous avons besoin seulement de la ou des colonnes de données que le modèle accepte en entrée. Ces colonnes sont appelées des caractéristiques. Dans notre scénario, si notre modèle accepte la taille du harnais pour estimer la taille de bottes, notre caractéristique est la taille du harnais.
Durant l’apprentissage, la fonction objective a généralement besoin de connaître la sortie du modèle et la réponse correcte. Ces valeurs sont appelées des étiquettes. Dans notre scénario, si notre modèle prédit la taille de bottes, cela signifie que la taille de bottes est notre étiquette.
Ainsi, pour utiliser un modèle, nous avons uniquement besoin des caractéristiques, alors que pendant l’entraînement, nous avons généralement besoin des caractéristiques et des étiquettes. Au cours de la formation dans notre scénario, nous avons besoin de notre caractéristique « taille de harnais » et de notre étiquette « taille de couvre-pattes ». Quand nous utilisons notre modèle dans notre site web, nous avons uniquement besoin de connaître la caractéristique « taille du harnais » : notre modèle estime ensuite la taille de bottes à utiliser.
J’ai terminé l’entraînement. Et maintenant ?
Une fois qu’un modèle a terminé la formation, il peut être enregistré tel quel dans un fichier. Nous n’avons plus besoin des données d’origine, de la fonction objectif ou de l’optimiseur de modèle. Quand nous voulons utiliser le modèle, nous pouvons le charger à partir du disque, lui fournir de nouvelles données et obtenir en retour une prédiction.
Dans le prochain exercice, nous allons nous entraîner à enregistrer un modèle, à le charger à partir du disque et à l’utiliser comme nous le ferions en situation réelle. Pour terminer notre scénario de magasin en ligne, nous allons également nous entraîner à utiliser les sorties du modèle afin d’avertir nos clients s’ils semblent acheter la mauvaise taille de bottes pour chiens.