Utforska finjustering av grundmodeller i Azure Machine Learning

Slutförd

Om du vill finjustera en grundmodell från modellkatalogen i Azure Machine Learning kan du använda användargränssnittet i studion, Python SDK eller Azure CLI.

Förbereda dina data och beräkning

Innan du kan finjustera en grundmodell för att förbättra modellprestandan måste du förbereda dina träningsdata och skapa ett GPU-beräkningskluster.

Dricks

När du skapar ett GPU-beräkningskluster i Azure Machine Learning skapas GPU-optimerad virtuell dator åt dig. Läs mer om de storlekar för virtuella GPU-datorer som är tillgängliga i Azure.

Träningsdata kan vara i JSON Lines-format (JSONL), CSV eller TSV. Kraven för dina data varierar beroende på vilken uppgift du tänker finjustera din modell för.

Uppgift Krav för datauppsättning
Textklassificering Två kolumner: Sentence (sträng) och Label (heltal/sträng)
Tokenklassificering Två kolumner: Token (sträng) och Tag (sträng)
Frågor och svar Fem kolumner: Question (sträng), Context (sträng), Answers (sträng), Answers_start (int) och Answers_text (sträng)
Summering Två kolumner: Document (sträng) och Summary (sträng)
Översättning Två kolumner: Source_language (sträng) och Target_language (sträng)

Kommentar

Din datauppsättning måste ha de nödvändiga kraven. Du kan dock använda olika kolumnnamn och mappa kolumnen till rätt krav.

När du har datamängden och beräkningsklustret redo kan du konfigurera ett finjusteringsjobb i Azure Machine Learning.

Välj en grundmodell

När du navigerar till modellkatalogen i Azure Machine Learning-studio kan du utforska alla grundmodeller.

Screenshot of model catalog in Azure Machine Learning.

Du kan filtrera tillgängliga modeller baserat på den uppgift som du vill finjustera en modell för. Per uppgift har du flera alternativ för grundmodeller att välja mellan. När du bestämmer mellan grundmodeller för en uppgift kan du undersöka beskrivningen av modellen och det refererade modellkortet.

Några saker du kan tänka på när du bestämmer dig för en grundmodell innan du finjusterar är:

  • Modellfunktioner: Utvärdera funktionerna i grundmodellen och hur väl de överensstämmer med din uppgift. Till exempel är en modell som BERT bättre på att förstå korta texter.
  • Förträningsdata: Överväg den datauppsättning som används för förträning av grundmodellen. GPT-2 tränas till exempel på ofiltrerat innehåll från Internet som kan leda till fördomar.
  • Begränsningar och fördomar: Var medveten om eventuella begränsningar eller fördomar som kan finnas i grundmodellen.
  • Språkstöd: Utforska vilka modeller som erbjuder det specifika språkstöd eller de flerspråkiga funktioner som du behöver för ditt användningsfall.

Dricks

Även om Azure Machine Learning-studio ger dig beskrivningar för varje grundmodell i modellkatalogen kan du också hitta mer information om varje modell via respektive modellkort. Modellkorten refereras i översikten över varje modell och finns på webbplatsen för Hugging Face

Konfigurera ett finjusteringsjobb

Om du vill konfigurera ett finjusteringsjobb med hjälp av Azure Machine Learning-studio måste du göra följande:

  1. Välj en grundmodell.
  2. Välj Finetune för att öppna ett popup-fönster som hjälper dig att konfigurera jobbet.
  3. Välj aktivitetstyp.
  4. Välj träningsdata och mappa kolumnerna i dina träningsdata till datauppsättningskraven.
  5. Låt antingen Azure Machine Learning automatiskt dela upp träningsdata för att skapa en validerings- och testdatauppsättning eller ange en egen.
  6. Välj ett GPU-beräkningskluster som hanteras av Azure Machine Learning.
  7. Välj Slutför för att skicka finjusteringsjobbet.

Dricks

Du kan också utforska de avancerade inställningarna för att ändra inställningar, till exempel namnet på finjusteringsjobbet och uppgiftsparametrarna (till exempel inlärningsfrekvensen).

Screenshot of fine-tuning job configuration.

När du har skickat finjusteringsjobbet skapas ett pipelinejobb för att träna din modell. Du kan granska alla indata och samla in modellen från jobbutdata.

Screenshot of completed pipeline job that fine-tuned a foundation model.