交談語言理解中使用的術語和定義
使用此文章了解使用交談語言理解時可能遇到的一些定義和術語。
實體
實體是語句中的單字,可描述用來滿足或識別意圖的資訊。 如果您的實體很複雜,而且您想要模型識別特定部分,您可以將模型分成子實體。 例如,您可能會想要讓模型預測地址,以及街道、城市、州和郵遞區號等子實體。
F1 分數
F1 分數是精確度和重新叫用率的函數。 當您尋求精確度與召回率的平衡時,需要此項目。
Intent
意圖代表使用者想要執行的工作或動作。 其是使用者輸入中表達的目的或目標,例如預訂班機或支付帳單。
清單實體
清單實體代表一組固定的封閉式相關字組及其同義字。 清單實體是完全相符的項目,與機器學習實體不同。
如果清單實體中的單字包含在清單中,則會預測實體。 例如,如果您有一個名為 "size" 的清單實體,而且清單中有 "small, medium, large" 的文字,則會針對所有語句預測大小實體,無論內容為何,都會使用 "small"、"medium" 或 "large" 等文字。
模型
模型是經過定型以執行特定工作 (在這個案例中為交談理解工作) 的物件。 模型的定型方式是提供用來學習的標記資料,以便稍後其可以用來了解語句。
- 模型評估是在定型之後立即進行的程序,可了解您模型執行的效果。
- 「部署」是將模型指派給部署以透過預測 API 使用該模型的程序。
過度學習
在特定範例上固定模型時,就會發生過度學習,而且無法充分一般化。
精確度
測量模型的精確/正確程度。 這是正確識別到的肯定 (確判為真) 與所有識別到的肯定之間的比率。 精確度計量會顯示已正確標示的預測類別數目。
Project
專案是一個工作區域,用於根據您的資料建置自訂 ML 模型。 專案只能由您和其他具有所使用 Azure 資源存取權的人員存取。
重新叫用
測量模型預測實際肯定類別的能力。 這是所預測確判為真與實際標記項目之間的比率。 召回率計量會顯示有多少預測類別是正確的。
規則運算式
規則運算式實體代表規則運算式。 規則運算式實體是完全符合。
結構描述
結構描述會定義為專案內意圖和實體的組合。 結構描述設計是您專案獲致成功的重要部分。 建立結構描述時,您需要考慮哪些意圖和實體應該包含在專案中。
訓練資料
定型資料是定型模型所需的一組資訊。
表達
語句是使用者輸入,這是對話中句子的簡短文字表示。 這是一種自然語言片語,例如「訂兩張機票下星期二到西雅圖」。 新增範例語句來定型模型,而模型會在執行階段於新語句上預測