Concepts d’optimisation des modèles
Le réglage précis est un processus consistant à prendre un modèle préentraîné et à l’ajuster pour mieux adapter vos données. Ce processus peut vous aider à tirer le meilleur parti de vos données et à améliorer les performances de votre modèle. Dans cet article, vous apprendrez les concepts de base de l'ajustement fin et quand il est approprié d'affiner un modèle IA.
Introduction
Le réglage précis est une technique puissante qui peut vous aider à tirer davantage parti de vos données. Pour comprendre l'ajustement fin, il est important de comprendre le concept d'apprentissage transférentiel. Le transfert d’apprentissage est une technique de Machine Learning où un modèle formé sur une tâche est réinitulé sur une deuxième tâche associée. Pour ce faire, prenez un modèle préentraîné et ajustez-le pour mieux adapter les nouvelles données. Le réglage précis est une forme d’apprentissage du transfert où le modèle préentraîné est ajusté pour mieux s’adapter aux nouvelles données.
Il existe plusieurs étapes impliquées dans l’optimisation d’un modèle. Tout d’abord, vous devez sélectionner un modèle préentraîné adapté à votre tâche. Ensuite, vous devez préparer vos exemples de données et affiner le modèle sur ces données. Enfin, vous devez itérer sur votre modèle pour améliorer ses performances.
Quand peaufiner
Le réglage précis est adapté aux moments où vous disposez d’une petite quantité de données et que vous souhaitez améliorer les performances de votre modèle. En commençant par un modèle préentraîné, vous pouvez tirer parti des connaissances que le modèle a déjà apprises et l’ajuster pour mieux adapter vos données. Cela peut vous aider à améliorer les performances de votre modèle et à réduire la quantité de données nécessaires pour l’entraîner.
Il n’est généralement pas nécessaire d’ajuster votre modèle lorsque vous avez une grande quantité de données. Dans ce cas, vous pouvez entraîner votre modèle à partir de zéro et obtenir de bonnes performances sans réglage précis. Toutefois, le réglage précis peut toujours être utile dans ce cas si vous souhaitez améliorer les performances de votre modèle plus loin. Vous pouvez également affiner votre modèle si vous avez une tâche spécifique différente de la tâche sur laquelle le modèle préentraîné a été formé à l’origine.
Vous pouvez éviter la mise au point coûteuse d'un modèle en recourant à l'ingénierie ou à l'enchaînement de requêtes. Ces techniques peuvent vous aider à générer du texte de haute qualité sans avoir besoin de réglage précis.
Sélectionner un modèle préentraîné
Vous devez sélectionner un modèle préentraîné adapté à vos besoins en matière de tâches. Il existe de nombreux modèles préentraînés qui ont été formés sur un large éventail de tâches. Vous devez choisir un modèle qui a été formé sur une tâche similaire à celle sur laquelle vous travaillez. Cela vous aidera à tirer parti des connaissances que le modèle a déjà apprises et à l’ajuster pour mieux adapter vos données.
Les modèles HuggingFace sont un bon point de départ lors de la recherche de modèles préentraînés. Les modèles HuggingFace sont regroupés en catégories en fonction de la tâche sur laquelle ils ont été formés, ce qui facilite la recherche d’un modèle adapté à votre tâche.
Ces catégories sont les suivantes :
- Multimodal
- Vision par ordinateur
- Traitement du langage naturel
- Audio
- Tabulaire
- Apprentissage par renforcement
Vérifiez la compatibilité du modèle avec votre environnement et les outils que vous utilisez. Par exemple, si vous utilisez Visual Studio Code, vous pouvez utiliser l’extension Azure Machine Learning pour Visual Studio Code pour affiner votre modèle.
Vérifiez l’état et la licence du modèle. Certains modèles préentraînés peuvent être disponibles sous une licence open source, tandis que d’autres peuvent nécessiter une licence commerciale ou personnelle à utiliser. Tous les modèles sur HuggingFace incluent des informations de licence. Vérifiez que vous disposez des autorisations nécessaires pour utiliser le modèle avant de l’ajuster.
Préparer vos exemples de données
La préparation de vos exemples de données implique le nettoyage et le prétraitement de vos données pour qu’elles conviennent à l’entraînement. Vous devez également fractionner vos données en jeux d’entraînement et de validation pour évaluer les performances de votre modèle. Le format de vos données doit correspondre au format attendu par le modèle préentraîné que vous utilisez. Ces informations se trouvent avec les modèles sur HuggingFace dans la section Format d'instruction de la carte de modèle. La plupart des fiches de modèle comprennent un modèle de requête pour le modèle et un pseudo-code pour vous aider à démarrer.
Itérer sur votre modèle
Une fois que vous avez affiné votre modèle, vous devez évaluer ses performances sur le jeu de validation. Vous pouvez utiliser des métriques telles que la précision, la précision, le rappel et le score F1 pour évaluer les performances de votre modèle. Si les performances de votre modèle ne sont pas satisfaisantes, vous pouvez itérer sur votre modèle en ajustant les hyperparamètres, en modifiant l’architecture ou en modifiant le modèle sur d’autres données. Vous pouvez également examiner la qualité et la diversité de vos données pour voir s’il existe des problèmes qui doivent être résolus. En règle générale, un plus petit ensemble de données de haute qualité est plus précieux qu’un plus grand ensemble de données de faible qualité.
Voir aussi
Pour en savoir plus sur l’optimisation des modèles IA, consultez les ressources suivantes :
- Affiner un modèle Llama 2 dans le portail Azure AI Foundry
- Affiner un modèle pré-entraîné sur HuggingFace
- Affiner un modèle pré-entraîné à l'aide de TensorFlow
Lors de l’utilisation des fonctionnalités IA, nous vous recommandons de passer en revue : Développement d’applications et de fonctionnalités d’INTELLIGENCE artificielle responsable sur Windows.