Trénování je proces, ve kterém se model učí z označených promluv. Po dokončení trénování budete moct zobrazit výkon modelu.
Pokud chcete vytrénovat model, spusťte trénovací úlohu. Pouze úspěšně dokončené úlohy vytvoří model. Platnost trénovacích úloh vyprší po sedmi dnech, po této době už nebudete moct načíst podrobnosti o úloze. Pokud se vaše trénovací úloha úspěšně dokončila a vytvořil se model, nebude to mít vliv na vypršení platnosti úlohy. Najednou můžete mít spuštěnou jenom jednu trénovací úlohu a nemůžete spustit jiné úlohy ve stejném projektu.
Časy trénování můžou být kdekoli během několika sekund při práci s jednoduchými projekty, až několik hodin, kdy dosáhnete maximálního limitu promluv.
Vyhodnocení modelu se aktivuje automaticky po úspěšném dokončení trénování. Proces vyhodnocení začíná použitím natrénovaného modelu ke spouštění predikcí promluv v testovací sadě a porovnává predikované výsledky s poskytnutými popisky (které stanoví směrný plán pravdy). Výsledky se vrátí, abyste mohli zkontrolovat výkon modelu.
Požadavky
Úspěšně vytvořený projekt s nakonfigurovaným účtem služby Azure Blob Storage
Další informace najdete v životním cyklu vývoje projektu.
Rozdělování dat
Než začnete s procesem trénování, označí se promluvy ve vašem projektu do trénovací sady a testovací sady. Každý z nich slouží jiné funkci.
Trénovací sada se používá při trénování modelu. Jedná se o sadu, ze které se model učí popisované promluvy.
Testovací sada je nevidomá sada , která se do modelu nevejde během trénování, ale pouze během vyhodnocení.
Po úspěšném vytrénování modelu je možné model použít k předpovědím z promluv v testovací sadě. Tyto předpovědi se používají k výpočtu metrik vyhodnocení.
Doporučujeme zajistit, aby všechny vaše záměry byly v trénovací i testovací sadě dostatečně reprezentované.
Pracovní postup orchestrace podporuje dvě metody rozdělení dat:
Automatické rozdělení testovací sady z trénovacích dat: Systém rozdělí označená data mezi trénovací a testovací sady podle procent, které zvolíte. Doporučené procento rozdělení je 80 % pro trénování a 20 % pro testování.
Poznámka:
Pokud zvolíte možnost Automatické rozdělení testovací sady z trénovacích dat , rozdělí se pouze data přiřazená k trénovací sadě podle zadaných procent.
Použijte ruční rozdělení trénovacích a testovacích dat: Tato metoda umožňuje uživatelům definovat, které promluvy mají patřit do které sady. Tento krok je povolený jenom v případě, že jste do testovací sady přidali promluvy během označování.
Poznámka:
Do trénovací datové sady můžete přidat jenom promluvy pro nesouvisené záměry.
V nabídce na levé straně vyberte Úlohy trénování .
V horní nabídce vyberte Spustit trénovací úlohu .
Vyberte Vytrénovat nový model a do textového pole zadejte název modelu. Existující model můžete také přepsat tak, že vyberete tuto možnost a zvolíte model, který chcete přepsat z rozevírací nabídky. Přepsání natrénovaného modelu je nevratné, ale nebude mít vliv na nasazené modely, dokud nový model nenasadíte.
Pokud jste projektu povolili ruční rozdělení dat při označování promluv, zobrazí se dvě možnosti rozdělení dat:
Automatické rozdělení testovací sady z trénovacích dat: Označené promluvy se náhodně rozdělí mezi trénovací a testovací sady podle vybraných procent. Výchozí procentuální rozdělení je 80 % pro trénování a 20 % pro testování. Pokud chcete tyto hodnoty změnit, zvolte, kterou sadu chcete změnit, a zadejte novou hodnotu.
Poznámka:
Pokud zvolíte možnost Automatické rozdělení testovací sady z trénovacích dat , rozdělí se jenom promluvy ve vaší trénovací sadě podle zadaných procent.
Použijte ruční rozdělení trénovacích a testovacích dat: Přiřaďte jednotlivé promluvy buď trénovací, nebo testovací sadě během kroku označování projektu.
Poznámka:
Použití ručního rozdělení trénovacích a testovacích dat bude povoleno pouze v případě, že přidáte promluvy do testovací sady na stránce s daty značek. Jinak se zakáže.
Vyberte tlačítko Trénovat.
Poznámka:
Pouze úspěšně dokončené trénovací úlohy vygenerují modely.
Trénování může nějakou dobu trvat několik minut až několik hodin na základě velikosti označených dat.
Najednou můžete mít spuštěnou pouze jednu úlohu trénování. Další trénovací úlohu nelze spustit tak dlouho, dokud se nespustí spuštěná úloha.
K odeslání trénovací úlohy vytvořte požadavek POST pomocí následující adresy URL, hlaviček a textu JSON.
Adresa URL požadavku
Při vytváření požadavku rozhraní API použijte následující adresu URL. Nahraďte níže uvedené zástupné hodnoty vlastními hodnotami.
Procento označených dat, která se mají zahrnout do trénovací sady Doporučená hodnota je 80.
80
testingSplitPercentage
20
Procento označených dat, která se mají zahrnout do testovací sady Doporučená hodnota je 20.
20
Poznámka:
testingSplitPercentage A trainingSplitPercentage jsou vyžadovány pouze v případě, že Kind je nastavena percentage hodnota a součet obou procent by měl být roven 100.
Po odeslání požadavku rozhraní API obdržíte 202 odpověď, která značí úspěch. V hlavičce odpovědi extrahujte operation-location hodnotu. Bude formátován takto:
V seznamu vyberte ID trénovací úlohy, zobrazí se boční podokno, kde můžete zkontrolovat průběh trénování, stav úlohy a další podrobnosti pro tuto úlohu.
Trénování může nějakou dobu trvat v závislosti na velikosti trénovacích dat a složitosti schématu. Pomocí následujícího požadavku můžete pokračovat v dotazování stavu úlohy trénování, dokud se úspěšně nedokončil.
Stav průběhu trénování modelu získáte pomocí následujícího požadavku GET . Nahraďte níže uvedené zástupné hodnoty vlastními hodnotami.
Pokud chcete zrušit trénovací úlohu v sadě Language Studio, přejděte na stránku Trénování modelu . Vyberte trénovací úlohu, kterou chcete zrušit, a v horní nabídce vyberte Zrušit .
Vytvořte požadavek POST pomocí následující adresy URL, hlaviček a textu JSON pro zrušení trénovací úlohy.
Adresa URL požadavku
Při vytváření požadavku rozhraní API použijte následující adresu URL. Nahraďte níže uvedené zástupné hodnoty vlastními hodnotami.
Název projektu. U této hodnoty se rozlišují malá a velká písmena.
EmailApp
{JOB-ID}
Toto je ID trénovací úlohy.
XXXXX-XXXXX-XXXX-XX
{API-VERSION}
Verze rozhraní API, které voláte.
2023-04-01
Hlavičky
K ověření požadavku použijte následující hlavičku.
Key
Hodnota
Ocp-Apim-Subscription-Key
Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.
Po odeslání požadavku rozhraní API obdržíte odpověď 202 označující úspěch, což znamená, že vaše trénovací úloha byla zrušena. Úspěšné výsledky volání s hlavičkou Operation-Location použitou ke kontrole stavu úlohy.