Delen via


Uw indelingswerkstroommodel trainen

Training is het proces waarbij het model leert van uw gelabelde uitingen. Nadat de training is voltooid, kunt u modelprestaties bekijken.

Als u een model wilt trainen, start u een trainingstaak. Alleen voltooide taken maken een model. Trainingstaken verlopen na zeven dagen. Na deze tijd kunt u de taakgegevens niet meer ophalen. Als uw trainingstaak is voltooid en er een model is gemaakt, wordt dit niet beïnvloed door het verlopen van de taak. U kunt slechts één trainingstaak tegelijk uitvoeren en u kunt geen andere taken in hetzelfde project starten.

De trainingstijden kunnen zich vanaf een paar seconden bevinden bij het omgaan met eenvoudige projecten, tot een paar uur wanneer u de maximumlimiet van utterances bereikt.

Modelevaluatie wordt automatisch geactiveerd nadat de training is voltooid. Het evaluatieproces begint met het getrainde model om voorspellingen uit te voeren op de uitingen in de testset en vergelijkt de voorspelde resultaten met de opgegeven labels (waarmee een basislijn van waarheid wordt vastgesteld). De resultaten worden geretourneerd, zodat u de prestaties van het model kunt bekijken.

Vereisten

  • Een project gemaakt met een geconfigureerd Azure Blob Storage-account

Zie de levenscyclus van projectontwikkeling voor meer informatie.

Gegevens splitsen

Voordat u het trainingsproces start, worden gelabelde uitingen in uw project onderverdeeld in een trainingsset en een testset. Elk van deze dient een andere functie. De trainingsset wordt gebruikt bij het trainen van het model. Dit is de set waaruit het model de gelabelde uitingen leert. De testset is een blinde set die tijdens de training niet is geïntroduceerd in het model, maar alleen tijdens de evaluatie.

Nadat het model is getraind, kan het model worden gebruikt om voorspellingen te doen van de uitingen in de testset. Deze voorspellingen worden gebruikt om metrische evaluatiegegevens te berekenen.

Het wordt aanbevolen om ervoor te zorgen dat al uw intenties adequaat worden vertegenwoordigd in zowel de trainings- als testset.

Indelingswerkstroom ondersteunt twee methoden voor het splitsen van gegevens:

  • Automatisch de testset splitsen op basis van trainingsgegevens: het systeem splitst uw getagde gegevens tussen de trainings- en testsets op basis van de percentages die u kiest. De aanbevolen percentagesplitsing is 80% voor training en 20% voor testen.

Notitie

Als u de testset automatisch splitst op basis van de optie trainingsgegevens , worden alleen de gegevens die aan de trainingsset zijn toegewezen, gesplitst volgens de opgegeven percentages.

  • Gebruik een handmatige splitsing van trainings- en testgegevens: met deze methode kunnen gebruikers definiëren welke utterances tot welke set moeten behoren. Deze stap is alleen ingeschakeld als u uitingen hebt toegevoegd aan uw testset tijdens het labelen.

Notitie

U kunt alleen utterances toevoegen in de trainingsgegevensset voor niet-verbonden intenties.

Model trainen

Trainingstaak starten

Ga als volgende te werk om uw model te trainen vanuit Language Studio:

  1. Selecteer Trainingstaken in het menu aan de linkerkant.

  2. Selecteer Een trainingstaak starten in het bovenste menu.

  3. Selecteer Een nieuw model trainen en typ de naam van het model in het tekstvak. U kunt ook een bestaand model overschrijven door deze optie te selecteren en het model te kiezen dat u wilt overschrijven in de vervolgkeuzelijst. Het overschrijven van een getraind model kan niet ongedaan worden gemaakt, maar dit heeft geen invloed op uw geïmplementeerde modellen totdat u het nieuwe model implementeert.

    Als u uw project hebt ingeschakeld om uw gegevens handmatig te splitsen bij het taggen van uw utterances, ziet u twee opties voor het splitsen van gegevens:

    • Automatisch de testset splitsen op basis van trainingsgegevens: uw getagde uitingen worden willekeurig verdeeld tussen de trainings- en testsets, afhankelijk van de percentages die u kiest. De standaardpercentagesplitsing is 80% voor training en 20% voor testen. Als u deze waarden wilt wijzigen, kiest u welke set u wilt wijzigen en typt u de nieuwe waarde.

    Notitie

    Als u de testset automatisch splitst op basis van de optie trainingsgegevens , worden alleen de uitingen in uw trainingsset gesplitst op basis van de opgegeven percentages.

    • Gebruik een handmatige splitsing van trainings- en testgegevens: wijs elke uiting toe aan de trainings- of testset tijdens de tagstap van het project.

    Notitie

    Gebruik een handmatige splitsing van de optie voor trainings- en testgegevens alleen als u uitingen toevoegt aan de testset op de pagina taggegevens. Anders wordt deze uitgeschakeld.

    Een schermopname van de pagina Train Model voor conversationele taalkennisprojecten.

  4. Selecteer de knop Trainen .

Notitie

  • Alleen voltooide trainingstaken genereren modellen.
  • Training kan enige tijd duren tussen een paar minuten en een paar uur op basis van de grootte van uw getagde gegevens.
  • U kunt slechts één trainingstaak tegelijk uitvoeren. U kunt geen andere trainingstaak starten voor hetzelfde project totdat de actieve taak is voltooid.

Trainingstaakstatus ophalen

Selecteer de id van de trainingstaak in de lijst. Er wordt een zijvenster weergegeven waarin u de voortgang van de training, de taakstatus en andere details voor deze taak kunt controleren.

Trainingstaak annuleren

Als u een trainingstaak vanuit Language Studio wilt annuleren, gaat u naar de pagina Model trainen . Selecteer de trainingstaak die u wilt annuleren en selecteer Annuleren in het bovenste menu.

Volgende stappen