Förstå när du ska finjustera en grundmodell

Slutförd

Genom att använda förtränad grundmodeller med öppen källkod kan du spara resurser. Ibland kan du behöva finjustera en grundmodell för att tillgodose dina specifika behov.

Utforska grundmodeller i modellkatalogen

Grundmodeller är stora maskininlärningsmodeller som redan har tränats att fungera som bas för en mängd olika användningsfall.

I Azure Machine Learning kan du utforska öppen källkod grundmodeller genom att söka igenom modellkatalogen. Vilken typ av grundmodell du behöver beror på vad du vill använda modellen för.

I allmänhet tränas grundmodeller på stora mängder data och utmärker sig för att utföra allmänna uppgifter som att förstå språk, generera text och förutsäga kontext. De kanske dock inte är det bästa valet om du behöver en modell som är skräddarsydd för en viss uppgift eller domän. I sådana fall kan finjustering av grundmodellen på uppgiftsspecifika data hjälpa dig att uppfylla dina specifika krav och uppnå bättre resultat.

Finjustera grundmodeller för specifika uppgifter

Även om grundmodellerna kanske redan uppfyller dina krav kan det vara nödvändigt för dig att finjustera en grundmodell.

Grundmodeller är förtränad på en mängd olika typer av text från Internet, vilket gör dem skickliga i allmän språkförstålning. Med finjustering kan du dock anpassa modellens kunskaper till en viss uppgift eller domän, optimera dess prestanda och se till att den utmärker sig i just den kontexten.

Några vanliga uppgifter som du kanske vill finjustera en grundmodell för är:

  • Textklassificering: Kategorisera en viss text i fördefinierade klasser eller kategorier baserat på dess innehåll eller kontext.
  • Tokenklassificering: Tilldela specifika etiketter eller taggar till enskilda token eller ord i en text, som ofta används i uppgifter som namngiven entitetsigenkänning.
  • Svar på frågor: Ge korrekta och relevanta svar på frågor som ställs på naturligt språk.
  • Sammanfattning: Skapa koncisa och sammanhängande sammanfattningar av längre texter och samla in viktig information.
  • Översättning: Konvertera text från ett språk till ett annat samtidigt som innebörden och kontexten bevaras.

Eftersom grundmodeller redan är förtränat behöver du en mindre uppgiftsspecifik datauppsättning för att finjustera en grundmodell. När du finjusterar en modell behöver du förmodligen mindre data och beräkning än när du tränar en modell från grunden.

Du kan finjustera en grundmodell från modellkatalogen i Azure Machine Learning. Du behöver bara en liten datauppsättning och ett GPU-kluster för att finjustera en modell.