Comprendre quand optimiser un modèle de base

Effectué

En utilisant des modèles de base open source préentraînés, vous pouvez économiser des ressources. Parfois, vous devrez peut-être optimiser un modèle de base pour qu’il réponde à vos besoins spécifiques.

Explorer les modèles de base dans le catalogue de modèles

Les modèles de base sont de grands modèles Machine Learning déjà formés pour servir de base à un large éventail de cas d’usage.

Dans Azure Machine Learning, vous pouvez explorer des modèles de base open source en effectuant une recherche dans le catalogue de modèles. Le type de modèle de base dont vous avez besoin dépend de ce pour quoi vous voulez utiliser le modèle.

En général, les modèles de base sont entraînés sur de grandes quantités de données et excellent dans l’exécution de tâches génériques, comme la compréhension du langage, la génération de texte et la prédiction de contexte. Cependant, ils peuvent ne pas être le meilleur choix si vous avez besoin d’un modèle adapté à une tâche ou un domaine spécifique. Dans ce cas, l’optimisation du modèle de base sur des données spécifiques à une tâche peut vous aider à répondre à vos besoins spécifiques et à obtenir de meilleurs résultats.

Optimisation de modèles de base pour des tâches spécifiques

Bien que les modèles de base puissent déjà répondre à vos besoins, il peut être nécessaire d’optimiser un modèle de base.

Les modèles de base sont préentraînés sur une large gamme de texte provenant d’Internet, ce qui les rend compétents en matière de compréhension générale du langage. Cependant, une optimisation vous permet d’adapter les connaissances du modèle à une tâche ou un domaine spécifique, en optimisant ses performances et en vous garantissant qu’il excelle dans ce contexte particulier.

Voici quelques-unes des tâches courantes pour lesquelles vous pouvez optimiser un modèle de base :

  • Classification de texte : catégorisation d’un texte donné en classes ou catégories prédéfinies en fonction de son contenu ou de son contexte.
  • Classification de jetons : affectation de libellés ou d’étiquettes spécifiques à des jetons ou des mots individuels dans un texte, souvent utilisés dans des tâches comme la reconnaissance d’entités nommées.
  • Réponses à des questions : fournir des réponses précises et pertinentes à des questions posées en langage naturel.
  • Synthèse : création de résumés concis et cohérents de textes plus longs, en capturant les informations essentielles.
  • Traduction : conversion de texte d’une langue à une autre tout en préservant le sens et le contexte.

Comme les modèles de base sont déjà préentraînés, vous avez besoin d’un jeu de données spécifique aux tâches plus petit pour optimiser un modèle de base. Quand vous optimisez un modèle, vous avez probablement besoin de moins de données et de calcul que quand vous entraînez un modèle à partir de zéro.

Vous pouvez optimiser un modèle de base provenant du catalogue de modèles dans Azure Machine Learning. Vous avez besoin seulement d’un petit jeu de données et d’un cluster GPU pour optimiser un modèle.