Dictado: MRTK2
Dictado permite a los usuarios grabar clips de audio y obtener una transcripción. Para usarlo, asegúrese de que un sistema de dictado está registrado en el perfil del sistema de entrada. El proveedor de entrada de dictado de Windows es el sistema de dictado que se proporciona de forma predeterminada, pero se pueden crear sistemas de dictado alternativos que implementan IMixedRealityDictationSystem
.
Requisitos
El sistema de dictado usa El dictadoRecognizer de Unity, que usa las API de voz de Windows subyacentes para controlar el dictado. Tenga en cuenta que esto implica que esta característica solo está presente en plataformas basadas en Windows.
El uso del sistema de dictado requiere las funcionalidades de aplicación "Cliente de Internet" y "Micrófono" en la sección PlayerSettings - Capabilities. Consulte Windows Mixed Reality documentación para obtener más detalles sobre la entrada de voz en Unity.
Configuración
Una vez configurado un servicio de dictado, puede usar el DictationHandler
script para iniciar y detener las sesiones de grabación y obtener los resultados de transcripción a través de UnityEvents.
- La hipótesis de dictado se genera a medida que el usuario habla con transcripciones aproximadas tempranas del audio capturado hasta ahora.
- El resultado del dictado se genera al final de cada oración (es decir, cuando el usuario se detiene) con la transcripción final del audio capturado hasta ahora.
- El dictado completo se genera al final de la sesión de grabación con la transcripción completa y final del audio.
- Se genera un error de dictado para informar de los errores en el servicio de dictado. La transcripción en este caso contiene una descripción del error.
Escena de ejemplo
La escena de dictado en MRTK/Examples/Demos/Input/Scenes/Dictation
muestra el DictationHandler
script en uso. Si necesita más control, puede ampliar este script o crear su propia implementación IMixedRealityDictationHandler
para recibir eventos de dictado directamente.