Dela via


Diktering – MRTK2

Diktering gör det möjligt för användare att spela in ljudklipp och få en transkription. Om du vill använda den kontrollerar du att ett dikteringssystem har registrerats i indatasystemprofilen. Windows Dictation Input Provider är dikteringssystemet som tillhandahålls direkt, men alternativa dikteringssystem kan skapas som implementerar IMixedRealityDictationSystem.

Krav

Dikteringssystemet använder Unitys diktatationRecognizer som själv använder de underliggande Windows-tal-API:erna för att hantera diktering. Observera att detta innebär att den här funktionen endast finns på Windows-baserade plattformar.

Användning av dikteringssystemet kräver både programfunktionerna "Internetklient" och "mikrofon" i avsnittet PlayerSettings - Capabilities. Mer information om röstindata finns i Windows Mixed Reality dokumentationen i Unity.

Konfiguration

Dataprovider

När du har konfigurerat en dikteringstjänst kan du använda skriptet DictationHandler för att starta och stoppa inspelningssessioner och hämta transkriptionsresultaten via UnityEvents.

Dikteringshanterare
  • Dikteringshypotesen höjs när användaren talar med tidiga, grova transkriptioner av ljudet som fångats hittills.
  • Dikteringsresultatet höjs i slutet av varje mening (d.v.s. när användaren pausar) med den slutliga transkriptionen av det ljud som avbildats hittills.
  • Diktering slutförs i slutet av inspelningssessionen med den fullständiga, slutliga transkriptionen av ljudet.
  • Dikteringsfel genereras för att informera om fel i dikteringstjänsten. Transkriptionen i det här fallet innehåller en beskrivning av felet.

Exempelscen

Dikteringsscen i MRTK/Examples/Demos/Input/Scenes/Dictation visar skriptet som DictationHandler används. Om du behöver mer kontroll kan du antingen utöka det här skriptet eller skapa en egen implementering IMixedRealityDictationHandler för att ta emot dikteringshändelser direkt.

Dikteringsdemo