Pour effectuer l’apprentissage d’un modèle, démarrez un travail d’apprentissage. Seuls les travaux terminés avec succès créent un modèle. Un travail d’apprentissage expire au bout de sept jours. Passé ce délai, il est impossible de récupérer les détails de ce travail. Si votre travail d’apprentissage s’est terminé avec succès et qu’un modèle a été créé, il ne sera pas affecté par l’expiration du travail. Vous ne pouvez exécuter qu’un seul travail d’apprentissage à la fois. Vous ne pouvez pas non plus lancer d’autres travaux au sein du même projet.
Les durées de formation peuvent être comprises entre quelques secondes, pour des projets simples, et quelques heures, lorsque vous atteignez la limite maximale des énoncés.
L’évaluation du modèle est déclenchée automatiquement une fois l’entraînement effectué. Le processus d’évaluation commence par utiliser le modèle formé pour exécuter des prédictions sur les énoncés du jeu de tests et compare les résultats prédits avec les étiquettes fournies (qui établit une base de référence de vérité). Les résultats sont renvoyés pour vous permettre d’examiner les performances du modèle.
Prérequis
Un projet créé correctement avec un compte de stockage Blob Azure configuré
Avant d’entamer le processus d’apprentissage, les énoncés étiquetés de votre projet sont divisés en deux jeux : un jeu d’apprentissage et un jeu de test. Chacun d’eux a une fonction différente.
Le jeu d’apprentissage est utilisé dans l’apprentissage du modèle. Il s’agit de l’ensemble à partir duquel le modèle apprend les énoncés étiquetés.
Le jeu de test est un jeu témoin qui n’est pas présenté au modèle pendant l’apprentissage, mais uniquement lors de l’évaluation.
Après l’apprentissage du modèle, il est utilisé pour effectuer des prédictions à partir des énoncés du jeu de tests. Ces prédictions sont utilisées pour calculer les métriques d’évaluation.
Nous vous recommandons de vérifier que toutes vos intentions sont correctement représentées dans les jeux d’apprentissage et de test.
Le flux de travail de l’ochestration prend en charge deux méthodes pour le fractionnement des données :
Fractionnement automatique du jeu de test à partir des données d’apprentissage : le système fractionne les données étiquetées en un jeu d’apprentissage et un jeu de test, selon les pourcentages que vous avez choisis. Le pourcentage recommandé pour le fractionnement est de 80 % pour l’apprentissage et de 20 % pour les tests.
Notes
Si vous choisissez l’option Fractionnement automatique du jeu de test à partir des données d’apprentissage, seules les données attribuées au jeu d’apprentissage sont fractionnées selon les pourcentages fournis.
Utiliser un fractionnement manuel des données d’apprentissage et de test : cette méthode permet aux utilisateurs de définir quels énoncés doivent appartenir à quel jeu. Cette étape est activée uniquement si vous avez ajouté des énoncés à votre jeu de test lors de l’étiquetage.
Notes
Vous ne pouvez ajouter que des énoncés dans le jeu de données d’entraînement pour les intentions non connectées uniquement.
Pour commencer à effectuer l’apprentissage de votre modèle à partir de Language Studio :
Dans le menu de gauche, sélectionnez Travaux d’entraînement.
Sélectionnez Démarrer un travail de formation dans le menu supérieur.
Sélectionnez Effectuer l’apprentissage d’un nouveau modèle, puis tapez le nom du modèle dans la zone de texte. Vous pouvez également remplacer un modèle existant en sélectionnant cette option et le modèle de votre choix dans le menu déroulant. La remplacement d’un modèle entraîné est irréversible. Toutefois, cela n’affecte pas vos modèles déployés tant que vous ne déployez pas le nouveau modèle.
Fractionnement automatique du jeu de test à partir des données d’entraînement : vos énoncés étiquetés sont fractionnés de façon aléatoire en jeux d’entraînement et de test, selon les pourcentages que vous avez choisis. Le pourcentage par défaut est de 80 % pour l’entraînement et de 20 % pour les tests. Pour changer ces valeurs, choisissez le jeu que vous voulez changer et tapez la nouvelle valeur.
Notes
Si vous choisissez l’option Fractionnement automatique du jeu de test à partir des données d’entraînement, seuls les énoncés présents dans votre jeu d’entraînement sont fractionnés selon les pourcentages indiqués.
Utiliser un fractionnement manuel des données d’entraînement et de test : affectez chaque énoncé au jeu d’entraînement ou de test à l’étape d’étiquetage du projet.
Notes
L’option Utiliser un fractionnement manuel des données d’entraînement et de test est activée uniquement si vous ajoutez des énoncés au jeu de test dans la page d’étiquetage des données. Sinon, elle sera désactivée.
Sélectionner le bouton Train (Entraîner).
Notes
Seuls les emplois de formation achevés avec succès génèrent des modèles.
L’entraînement peut durer de quelques minutes à quelques heures en fonction de la taille de vos données étiquetées.
Vous ne pouvez avoir qu’un seul travail d’entraînement en cours d’exécution à la fois. Vous ne pouvez pas démarrer un autre travail d’apprentissage dans le même projet tant que le travail en cours d’exécution n’est pas terminé.
Créez une requête POST en utilisant l’URL, les en-têtes et le corps JSON suivants pour envoyer un travail d’apprentissage.
URL de la demande
Utilisez l’URL suivante quand vous créez votre demande d’API. Remplacez les valeurs d’espace réservé suivantes par vos valeurs :
Mode d'apprentissage. Un seul mode pour l’entraînement est disponible dans l’orchestration, qui est standard.
standard
trainingConfigVersion
{CONFIG-VERSION}
Version du modèle de configuration de formation. Par défaut, la dernière version du modèle est utilisée.
2022-05-01
kind
percentage
Méthodes de fractionnement. Les valeurs possibles sont percentage ou manual. Pour plus d’informations, consultez Comment entraîner un modèle.
percentage
trainingSplitPercentage
80
Pourcentage de vos données étiquetées à inclure dans le jeu d’apprentissage. La valeur recommandée est 80.
80
testingSplitPercentage
20
Pourcentage de vos données étiquetées à inclure dans le jeu de test. La valeur recommandée est 20.
20
Notes
Les trainingSplitPercentage et testingSplitPercentage sont nécessaires uniquement si Kind est défini sur percentage. La somme des deux pourcentages doit être égale à 100.
Une fois que vous avez envoyé votre demande d’API, vous recevez une réponse 202 indiquant la réussite. Dans les en-têtes de réponse, extrayez la valeur operation-location. Elle est au format suivant :
Sélectionnez l’ID du travail d’apprentissage dans la liste, un volet latéral apparaîtra où vous pourrez vérifier la Progression de l’apprentissage, l’État du travail et d’autres détails pour ce travail.
L’apprentissage peut durer un certain temps en fonction de la taille de vos données d’apprentissage et de la complexité de votre schéma. Vous pouvez utiliser la requête suivante pour continuer à interroger l’état du travail d’apprentissage jusqu’à ce qu’il soit effectué avec succès.
Utilisez la requête GET suivante pour obtenir l’état de progression du processus d’apprentissage de votre modèle. Remplacez les valeurs d’espace réservé suivantes par vos valeurs :
Nom de votre projet. Cette valeur respecte la casse.
EmailApp
{JOB-ID}
ID de localisation de l’état d’entraînement de votre modèle. Il s’agit de la valeur d’en-tête location que vous avez reçue lors de l’envoi de votre travail de formation.
Utilisez l’en-tête suivant pour authentifier votre demande.
Clé
Valeur
Ocp-Apim-Subscription-Key
Clé de votre ressource. Utilisée pour authentifier vos demandes d’API.
Corps de la réponse
Une fois que vous avez envoyé la demande, vous recevez la réponse suivante. Continuez à interroger ce point de terminaison jusqu’à ce que le paramètre status passe à « réussi ».
Pour annuler un travail d’apprentissage dans Language Studio, accédez à la page Effectuer l’apprentissage du modèle. Sélectionnez le travail d’apprentissage à annuler, puis sélectionnez Annuler dans le menu supérieur.
Créez une requête POST en utilisant l’URL, les en-têtes et le corps JSON suivants pour annuler un travail d’apprentissage.
URL de la demande
Utilisez l’URL suivante quand vous créez votre demande d’API. Remplacez les valeurs d’espace réservé suivantes par vos valeurs :
Utilisez l’en-tête suivant pour authentifier votre demande.
Clé
Valeur
Ocp-Apim-Subscription-Key
Clé de votre ressource. Utilisée pour authentifier vos demandes d’API.
Après avoir envoyé votre demande d’API, vous recevez une réponse 202 de réussite, ce qui signifie que votre travail d’apprentissage a été annulé. Un appel réussi donne un en-tête Operation-Location utilisé pour vérifier l’état du travail.