Om du vill träna en modell startar du ett träningsjobb. Endast slutförda jobb skapar en modell. Träningsjobb upphör att gälla efter sju dagar, efter den här tiden kommer du inte längre att kunna hämta jobbinformationen. Om ditt träningsjobb har slutförts och en modell har skapats påverkas det inte av att jobbet upphör att gälla. Du kan bara ha ett träningsjobb i taget och du kan inte starta andra jobb i samma projekt.
Träningstiderna kan vara var som helst från några sekunder när du hanterar enkla projekt, upp till ett par timmar när du når den maximala gränsen för yttranden.
Modellutvärdering utlöses automatiskt när träningen har slutförts. Utvärderingsprocessen börjar med att använda den tränade modellen för att köra förutsägelser på yttrandena i testuppsättningen och jämför de förutsagda resultaten med de angivna etiketterna (som upprättar en baslinje för sanning). Resultaten returneras så att du kan granska modellens prestanda.
Förutsättningar
Ett projekt som har skapats med ett konfigurerat Azure Blob Storage-konto
Mer information finns i livscykeln för projektutveckling.
Datadelning
Innan du påbörjar träningsprocessen delas märkta yttranden i projektet in i en träningsuppsättning och en testuppsättning. Var och en av dem har olika funktioner.
Träningsuppsättningen används för att träna modellen. Det här är den uppsättning som modellen lär sig de märkta yttrandena från.
Testuppsättningen är en blinduppsättning som inte introduceras i modellen under träningen utan bara under utvärderingen.
När modellen har tränats kan modellen användas för att göra förutsägelser från yttrandena i testuppsättningen. Dessa förutsägelser används för att beräkna utvärderingsmått.
Vi rekommenderar att du ser till att alla avsikter är tillräckligt representerade i både tränings- och testuppsättningen.
Arbetsflödet för orkestrering stöder två metoder för datadelning:
Dela automatiskt upp testuppsättningen från träningsdata: Systemet delar dina taggade data mellan tränings- och testuppsättningarna enligt de procentsatser du väljer. Den rekommenderade procentuella uppdelningen är 80 % för träning och 20 % för testning.
Kommentar
Om du väljer alternativet Dela upp testuppsättningen automatiskt från träningsdata delas endast de data som tilldelats träningsuppsättningen upp enligt de procentsatser som anges.
Använd en manuell uppdelning av tränings- och testdata: Med den här metoden kan användarna definiera vilka yttranden som ska tillhöra vilken uppsättning. Det här steget aktiveras bara om du har lagt till yttranden i testuppsättningen under etikettering.
Kommentar
Du kan bara lägga till yttranden i träningsdatauppsättningen endast för icke-anslutna avsikter.
Välj Starta ett träningsjobb på den översta menyn.
Välj Träna en ny modell och skriv in modellnamnet i textrutan. Du kan också skriva över en befintlig modell genom att välja det här alternativet och välja den modell som du vill skriva över från den nedrullningsbara menyn. Att skriva över en tränad modell är oåterkalleligt, men det påverkar inte dina distribuerade modeller förrän du distribuerar den nya modellen.
Om du har aktiverat projektet för att dela dina data manuellt när du taggar dina yttranden visas två alternativ för datadelning:
Dela automatiskt upp testuppsättningen från träningsdata: Dina taggade yttranden delas slumpmässigt mellan tränings- och testuppsättningarna enligt de procentandelar du väljer. Standardprocentdelningen är 80 % för träning och 20 % för testning. Om du vill ändra dessa värden väljer du vilken uppsättning du vill ändra och skriver in det nya värdet.
Kommentar
Om du väljer alternativet Dela upp testuppsättningen automatiskt från träningsdata delas endast yttrandena i träningsuppsättningen upp enligt de procentsatser som anges.
Använd en manuell uppdelning av tränings- och testdata: Tilldela varje yttrande till antingen tränings- eller testuppsättningen under taggningssteget i projektet.
Kommentar
Använd en manuell delning av alternativet tränings- och testdata aktiveras endast om du lägger till yttranden i testuppsättningen på taggdatasidan. Annars inaktiveras den.
Välj knappen Träna.
Kommentar
Endast slutförda träningsjobb genererar modeller.
Träningen kan ta lite tid mellan ett par minuter och ett par timmar baserat på storleken på dina taggade data.
Du kan bara köra ett träningsjobb i taget. Du kan inte starta ett annat träningsjobb med samma projekt förrän jobbet som körs har slutförts.
Skapa en POST-begäran med hjälp av följande URL, rubriker och JSON-brödtext för att skicka ett träningsjobb.
Begärans-URL
Använd följande URL när du skapar din API-begäran. Ersätt platshållarvärdena nedan med dina egna värden.
Procentandel av dina taggade data som ska ingå i träningsuppsättningen. Rekommenderat värde är 80.
80
testingSplitPercentage
20
Procentandel av dina taggade data som ska ingå i testuppsättningen. Rekommenderat värde är 20.
20
Kommentar
Och trainingSplitPercentagetestingSplitPercentage krävs endast om Kind anges till percentage och summan av båda procentandelarna ska vara lika med 100.
När du har skickat din API-begäran får du ett 202 svar som anger att det har lyckats. Extrahera värdet i svarshuvudena operation-location . Den formateras så här:
Välj träningsjobbets ID i listan, en sidoruta visas där du kan kontrollera träningsförloppet, jobbstatusen och annan information för det här jobbet.
Träningen kan ta en stund beroende på storleken på dina träningsdata och schemats komplexitet. Du kan använda följande begäran för att fortsätta avsöka statusen för träningsjobbet tills det har slutförts.
Använd följande GET-begäran för att få status för din modells träningsförlopp. Ersätt platshållarvärdena nedan med dina egna värden.
Om du vill avbryta ett träningsjobb från Language Studio går du till sidan Träna modell . Välj det träningsjobb som du vill avbryta och välj Avbryt på den översta menyn.
Skapa en POST-begäran med hjälp av följande URL, rubriker och JSON-brödtext för att avbryta ett träningsjobb.
Begärans-URL
Använd följande URL när du skapar din API-begäran. Ersätt platshållarvärdena nedan med dina egna värden.
Använd följande rubrik för att autentisera din begäran.
Tangent
Värde
Ocp-Apim-Subscription-Key
Nyckeln till resursen. Används för att autentisera dina API-begäranden.
När du har skickat din API-begäran får du ett 202-svar som anger att det lyckades, vilket innebär att ditt träningsjobb har avbrutits. Ett lyckat anrop resulterar med en rubrik för Åtgärd-plats som används för att kontrollera jobbets status.