Concepten voor het verfijnen van modellen
Fine-tuning is een proces waarbij een vooraf getraind model wordt gebruikt en aangepast om uw gegevens beter aan te passen. Dit proces kan u helpen het meeste uit uw gegevens te halen en de prestaties van uw model te verbeteren. In dit artikel leert u de basisconcepten van fine-tuning en wanneer u een AI-model nauwkeurig kunt afstemmen.
Introductie
Fine-tuning is een krachtige techniek waarmee u meer uit uw gegevens kunt halen. Om inzicht te hebben in het afstemmen, is het belangrijk om het concept van transfer learning te begrijpen. Transfer learning is een machine learning-techniek waarbij een model dat is getraind voor één taak, opnieuw wordt gebruikt voor een tweede gerelateerde taak. Dit wordt gedaan door een vooraf getraind model te nemen en het aan te passen aan de nieuwe gegevens. Fine-tuning is een vorm van overdrachtsleer waarbij het vooraf getrainde model wordt aangepast aan de nieuwe gegevens.
Er zijn verschillende stappen betrokken bij het verfijnen van een model. Eerst moet u een vooraf getraind model selecteren dat geschikt is voor uw taak. Vervolgens moet u uw voorbeeldgegevens voorbereiden en het model verfijnen op deze gegevens. Ten slotte moet u uw model herhalen om de prestaties te verbeteren.
Wanneer fijn afstellen
Fijnafstemming is geschikt voor tijden waarin u een kleine hoeveelheid gegevens hebt en de prestaties van uw model wilt verbeteren. Door te beginnen met een vooraf getraind model, kunt u gebruikmaken van de kennis die het model al heeft geleerd en kunt u het aanpassen aan uw gegevens. Zo kunt u de prestaties van uw model verbeteren en de hoeveelheid gegevens verminderen die nodig zijn om het te trainen.
Het is meestal niet nodig om uw model af te stemmen wanneer u een grote hoeveelheid gegevens hebt. In dit geval kunt u uw model helemaal zelf trainen en goede prestaties bereiken zonder dat u ze hoeft af te stemmen. Het kan echter nog steeds handig zijn in dit geval als u de prestaties van uw model verder wilt verbeteren. U kunt uw model ook verfijnen als u een specifieke taak hebt die verschilt van de taak waarop het vooraf getrainde model oorspronkelijk is getraind.
Mogelijk kunt u het kostbare afstemmen van een model vermijden door promptbewerking of promptketening te gebruiken. Deze technieken kunnen u helpen bij het genereren van tekst van hoge kwaliteit zonder dat u hoeft af te stemmen.
Een vooraf getraind model selecteren
U moet een vooraf getraind model selecteren dat geschikt is voor uw taakvereisten. Er zijn veel vooraf getrainde modellen beschikbaar die zijn getraind voor een breed scala aan taken. U moet een model kiezen dat is getraind voor een vergelijkbare taak als het model waaraan u werkt. Dit helpt u om gebruik te maken van de kennis die het model al heeft geleerd en deze aan te passen aan uw gegevens.
HuggingFace modellen zijn een goede plek om te beginnen bij het zoeken naar vooraf getrainde modellen. De HuggingFace-modellen worden gegroepeerd in categorieën op basis van de taak waarop ze zijn getraind, zodat u eenvoudig een model kunt vinden dat geschikt is voor uw taak.
Deze categorieën zijn onder andere:
- Multimodale
- Computerzicht
- Verwerking van natuurlijke taal
- Geluid
- Tabelvorm
- Bekrachtigingsleren
Controleer de compatibiliteit van het model met uw omgeving en de hulpprogramma's die u gebruikt. Als u bijvoorbeeld Visual Studio Codegebruikt, kunt u de Azure Machine Learning-extensie voor Visual Studio Code gebruiken om uw model af te stemmen.
Controleer de status en licentie van het model. Sommige vooraf getrainde modellen zijn mogelijk beschikbaar onder een opensource-licentie, terwijl andere mogelijk een commerciële of persoonlijke licentie nodig hebben om te gebruiken. Alle modellen op HuggingFace bevatten licentiegegevens. Zorg ervoor dat u over de benodigde machtigingen beschikt om het model te gebruiken voordat u het kunt afstemmen.
Uw voorbeeldgegevens voorbereiden
Het voorbereiden van uw voorbeeldgegevens omvat het opschonen en verwerken van uw gegevens om deze geschikt te maken voor training. U moet uw gegevens ook splitsen in trainings- en validatiesets om de prestaties van uw model te evalueren. De indeling van uw gegevens moet overeenkomen met de indeling die wordt verwacht door het vooraf getrainde model dat u gebruikt. Deze informatie is te vinden bij de modellen op HuggingFace in het instructieformat, sectie van de modelkaart. De meeste modelkaarten bevatten een sjabloon voor het bouwen van een prompt voor het model en enkele pseudocode om u op weg te helpen.
Itereren op uw model
Zodra u uw model hebt afgestemd, moet u de prestaties van de validatieset evalueren. U kunt metrieke zoals nauwkeurigheid, precisie, terugroepingspercentage en F1-score gebruiken om de prestaties van uw model te evalueren. Als de prestaties van uw model niet bevredigend zijn, kunt u het model herhalen door de hyperparameters aan te passen, de architectuur te wijzigen of het model af te stemmen op meer gegevens. U kunt ook de kwaliteit en diversiteit van uw gegevens onderzoeken om te zien of er problemen zijn die moeten worden aangepakt. In de regel is een kleinere set gegevens van hoge kwaliteit waardevoller dan een grotere set gegevens van lage kwaliteit.
Zie ook
Raadpleeg de volgende bronnen voor meer informatie over het verfijnen van AI-modellen:
- een Llama 2-model verfijnen in de Azure AI Foundry-portal
- een vooraf getraind model afstemmen op HuggingFace
- een vooraf getraind model afstemmen met TensorFlow
Bij het gebruik van AI-functies raden we u aan het volgende te bekijken: Ontwikkelen van verantwoorde Generatieve AI-toepassingen en -functies in Windows.