Utforska finjustering av grundmodeller i Azure Machine Learning
Om du vill finjustera en grundmodell från modellkatalogen i Azure Machine Learning kan du använda användargränssnittet i studion, Python SDK eller Azure CLI.
Förbereda dina data och beräkning
Innan du kan finjustera en grundmodell för att förbättra modellprestandan måste du förbereda dina träningsdata och skapa ett GPU-beräkningskluster.
Dricks
När du skapar ett GPU-beräkningskluster i Azure Machine Learning skapas GPU-optimerad virtuell dator åt dig. Läs mer om de storlekar för virtuella GPU-datorer som är tillgängliga i Azure.
Träningsdata kan vara i JSON Lines-format (JSONL), CSV eller TSV. Kraven för dina data varierar beroende på vilken uppgift du tänker finjustera din modell för.
Uppgift | Krav för datauppsättning |
---|---|
Textklassificering | Två kolumner: Sentence (sträng) och Label (heltal/sträng) |
Tokenklassificering | Två kolumner: Token (sträng) och Tag (sträng) |
Frågor och svar | Fem kolumner: Question (sträng), Context (sträng), Answers (sträng), Answers_start (int) och Answers_text (sträng) |
Summering | Två kolumner: Document (sträng) och Summary (sträng) |
Översättning | Två kolumner: Source_language (sträng) och Target_language (sträng) |
Kommentar
Din datauppsättning måste ha de nödvändiga kraven. Du kan dock använda olika kolumnnamn och mappa kolumnen till rätt krav.
När du har datamängden och beräkningsklustret redo kan du konfigurera ett finjusteringsjobb i Azure Machine Learning.
Välj en grundmodell
När du navigerar till modellkatalogen i Azure Machine Learning-studio kan du utforska alla grundmodeller.
Du kan filtrera tillgängliga modeller baserat på den uppgift som du vill finjustera en modell för. Per uppgift har du flera alternativ för grundmodeller att välja mellan. När du bestämmer mellan grundmodeller för en uppgift kan du undersöka beskrivningen av modellen och det refererade modellkortet.
Några saker du kan tänka på när du bestämmer dig för en grundmodell innan du finjusterar är:
- Modellfunktioner: Utvärdera funktionerna i grundmodellen och hur väl de överensstämmer med din uppgift. Till exempel är en modell som BERT bättre på att förstå korta texter.
- Förträningsdata: Överväg den datauppsättning som används för förträning av grundmodellen. GPT-2 tränas till exempel på ofiltrerat innehåll från Internet som kan leda till fördomar.
- Begränsningar och fördomar: Var medveten om eventuella begränsningar eller fördomar som kan finnas i grundmodellen.
- Språkstöd: Utforska vilka modeller som erbjuder det specifika språkstöd eller de flerspråkiga funktioner som du behöver för ditt användningsfall.
Dricks
Även om Azure Machine Learning-studio ger dig beskrivningar för varje grundmodell i modellkatalogen kan du också hitta mer information om varje modell via respektive modellkort. Modellkorten refereras i översikten över varje modell och finns på webbplatsen för Hugging Face
Konfigurera ett finjusteringsjobb
Om du vill konfigurera ett finjusteringsjobb med hjälp av Azure Machine Learning-studio måste du göra följande:
- Välj en grundmodell.
- Välj Finetune för att öppna ett popup-fönster som hjälper dig att konfigurera jobbet.
- Välj aktivitetstyp.
- Välj träningsdata och mappa kolumnerna i dina träningsdata till datauppsättningskraven.
- Låt antingen Azure Machine Learning automatiskt dela upp träningsdata för att skapa en validerings- och testdatauppsättning eller ange en egen.
- Välj ett GPU-beräkningskluster som hanteras av Azure Machine Learning.
- Välj Slutför för att skicka finjusteringsjobbet.
Dricks
Du kan också utforska de avancerade inställningarna för att ändra inställningar, till exempel namnet på finjusteringsjobbet och uppgiftsparametrarna (till exempel inlärningsfrekvensen).
När du har skickat finjusteringsjobbet skapas ett pipelinejobb för att träna din modell. Du kan granska alla indata och samla in modellen från jobbutdata.