Termíny a definice používané v porozumění jazyku konverzace
V tomto článku se dozvíte o některých definicích a termínech, se kterými se můžete setkat při používání jazyka konverzace.
Entity
Entity jsou slova v promluvách, které popisují informace používané k plnění nebo identifikaci záměru. Pokud je entita složitá a chcete, aby model identifikoval konkrétní části, můžete model rozdělit na dílčí části. Můžete například chtít, aby model předpověděl adresu, ale také subentity ulice, města, státu a PSČ.
F1 – skóre
Skóre F1 je funkce přesnosti a úplnosti. Je potřeba, když hledáte rovnováhu mezi přesností a úplností.
Záměr
Záměr představuje úkol nebo akci, kterou chce uživatel provést. Jedná se o účel nebo cíl vyjádřený ve vstupu uživatele, jako je rezervace letu nebo platba faktury.
Entita seznamu
Entita seznamu představuje pevnou uzavřenou sadu souvisejících slov spolu s jejich synonymy. Entity seznamu jsou přesné shody, na rozdíl od strojově naučených entit.
Entita bude předpovězena, pokud je v seznamu zahrnuto slovo v entitě seznamu. Pokud máte například entitu seznamu s názvem "velikost" a v seznamu máte slova "malá, střední, velká", pak entita velikosti bude předpovězena pro všechny promluvy, ve kterých se slova "malá", "střední" nebo "velká" používají bez ohledu na kontext.
Model
Model je objekt, který je natrénovaný tak, aby dělal určitý úkol, v tomto případě konverzace rozumí úkolům. Modely se trénují tím, že poskytují označená data, ze které se mají učit, aby je bylo možné později použít k pochopení promluv.
- Vyhodnocení modelu je proces, který se děje hned po trénování, abyste věděli, jak dobře model funguje.
- Nasazení je proces přiřazení modelu k nasazení, aby byl dostupný pro použití prostřednictvím rozhraní API pro predikce.
Přeurčení
K přeurčení dojde, když je model opravený na konkrétních příkladech a není schopen dobře generalizovat.
Počet deset. míst
Měří, jak přesný/přesný model je. Jedná se o poměr mezi správně identifikovanými pozitivními výsledky (pravdivě pozitivními výsledky) a všemi identifikovanými pozitivními výsledky. Metrika přesnosti ukazuje, kolik predikovaných tříd je správně označeno.
Projekt
Projekt je pracovní oblast pro vytváření vlastních modelů ML na základě vašich dat. K vašemu projektu může přistupovat jenom vy a ostatní, kteří mají přístup k používanému prostředku Azure.
Odvolat
Měří schopnost modelu předpovědět skutečné kladné třídy. Jedná se o poměr mezi predikovanými pravdivě pozitivními výsledky a skutečným příznakem. Metrika úplnosti ukazuje, kolik predikovaných tříd je správné.
Regulární výraz
Entita regulárního výrazu představuje regulární výraz. Entity regulárních výrazů jsou přesné shody.
Schéma
Schéma je definováno jako kombinace záměrů a entit v rámci projektu. Návrh schématu je zásadní součástí úspěchu projektu. Při vytváření schématu chcete uvažovat o tom, které záměry a entity by se měly zahrnout do projektu.
Data pro trénink
Trénovací data jsou sada informací potřebných k trénování modelu.
Výrok
Promluva je uživatelský vstup, který představuje krátký textový zástupce věty v konverzaci. Je to fráze přirozeného jazyka, jako je například "rezervovat 2 lístky do Seattlu příští úterý". Ukázkové promluvy se přidají pro trénování modelu a model předpovídá na nové promluvě za běhu.