Compartir a través de


Administrar los controles de tecnología de reconocimiento de voz para un altavoz inteligente

Este artículo proporciona instrucciones sobre cómo los administradores pueden habilitar el reconocimiento de voz y la transcripción en directo para las reuniones que se realizan. Como administrador, tiene la capacidad de ajustar hasta qué punto su organización permite a los usuarios usar el reconocimiento de voz y las capacidades de los altavoces inteligentes.

Nota

El altavoz inteligente está disponible en todos los países y regiones. Consulte Configuraciones regionales admitidas para obtener una lista de las configuraciones regionales compatibles actualmente con la inscripción biométrica y la transcripción en la reunión.

Nota

  • Salas de Teams: Los altavoces inteligentes están disponibles para los clientes con licencias de Teams Room Pro.
  • Habitaciones BYOD: Altavoces inteligentes disponibles en salas donde el anfitrión de la sala tiene una licencia de Microsoft Teams Premium o Copilot.
  • Los dispositivos seleccionados con licencias de Salas de Microsoft Teams Premium heredadas seguirán siendo compatibles.

Optimización de la precisión de la transcripción con altavoces inteligentes

Cuando haya activado Altavoz inteligente para su Salas de Microsoft Teams, la transcripción de la reunión no solo podrá distinguir entre diferentes oradores de la sala, sino también identificarlos y atribuirlos a la persona correcta. El altavoz inteligente permite casos de uso críticos para Copilot y un resumen inteligente.

El reconocimiento de altavoces está habilitado por altavoces inteligentes certificados para Teams. Los altavoces inteligentes certificados están diseñados con varios micrófonos para proporcionar audio de alta calidad, maximizar la precisión en el reconocimiento y la transcripción, y cuentan con una reducción líder en la industria de lo que se conoce como "tasa de error de palabras".

Dicho esto, lo obtenemos: el hardware con certificación de altavoz inteligente aún no está disponible en todas las salas de reuniones. Por eso ampliamos esta característica al hardware existente. Aunque estamos encantados de ampliar la capacidad de reconocimiento de altavoces a más salas, es importante tener en cuenta que la calidad puede no coincidir con la de un dispositivo con certificación de altavoz inteligente. Por lo tanto, es esencial evaluar las ventajas de incorporar un orador inteligente certificado, especialmente en espacios cruciales donde lograr la transcripción y atribución de la más alta calidad es vital.

Mantener su identidad en reuniones optimizadas para Copilot y resumen de reuniones

La entrada más esencial para Copilot en Teams es la identidad de cada orador. Copiloto necesita una transcripción de la reunión, con atribución para cada orador, para ofrecer resúmenes de la reunión, perspectivas y elementos de acción. En una reunión híbrida, sin el reconocimiento de oradores, el vídeo y la fuente de audio de las personas de la sala se atribuirían al espacio (por ejemplo, sala de conferencias 1), no a las personas que hablan, lo que dificultaba consultar las contribuciones de los usuarios, resumir las perspectivas de todos y abordar esas tareas pendientes.

Salas de Teams y byod rooms utilizan tecnología avanzada llamada reconocimiento de altavoces para analizar las características vocales diferentes de cada orador, como el tono, el tono y el estilo hablador, para crear una huella vocal para cada participante, similar a una huella digital para su voz.

Con el reconocimiento de altavoces, los altavoces se pueden identificar durante la transcripción en directo en salas de reuniones compartidas, lo que garantiza una captura de voz clara y precisa para cada participante. Esto le permite realizar un seguimiento sin esfuerzo de quién dijo qué durante la reunión a través de un resumen inteligente de la reunión y Copilot.

Para habilitar el reconocimiento de altavoces para los empleados, puede configurar un perfil de voz en cuestión de segundos con la aplicación de escritorio de Teams. Cada persona obtiene una firma de voz única, almacenada de forma segura en el espacio empresarial de su organización en Microsoft Cloud para garantizar que todas las contribuciones se capturan con precisión en cada reunión, lo que habilita copiloto y resumen inteligente de reuniones, y le ayuda a impulsar su trabajo hacia adelante.

Captura de pantalla que muestra una reunión en curso.

Requisitos y recomendaciones

Salas de Teams:

  • Salas de Teams en Windows

  • La cuenta de recursos de sala debe tener asignada una licencia de Teams Room Pro.

  • Para garantizar la mejor precisión para la transcripción, le sugerimos limitar el número de asistentes en persona a un máximo de 10 personas.

  • Personas identificarse en la sala, debe inscribirse con su perfil de voz e invitarlo a la reunión programada.

  • La limitación para las personas invitadas con perfil de voz es actualmente 20.

  • Para admitir audio y vídeo de alta calidad durante las reuniones, recomendamos que la sala de reuniones tenga una velocidad de carga de al menos 7 Mbps.

Habitaciones BYOD:

  • Cliente de escritorio de Teams en Windows o Mac OS.

  • Los hosts de salas deben tener Teams Premium o una licencia de Copilot.

  • Para garantizar la mejor precisión para la transcripción, le sugerimos limitar el número de asistentes en persona a un máximo de 10 personas.

  • Los usuarios pueden usar cualquier micrófono de altavoz en una sala y pueden conectarlo a través de USB a sus portátiles.

  • Los usuarios deben asegurarse de que su cliente de Teams está actualizado.

  • La limitación actual para las personas invitadas con perfil de voz es actualmente 20.

Nota

El anfitrión de la sala es la persona que conecta su portátil al altavoz inteligente.

Nota

Hemos ampliado los altavoces inteligentes para trabajar con todos los micrófonos certificados. Puedes probar esto para Salas de Teams con la versión 5.0.111.0 o posterior.

Habilitar un reconocimiento de usuario de altavoz inteligente

Los datos de perfil de voz se pueden usar en cualquier reunión con un altavoz inteligente. Vea Directivas de reuniones de Teams y los cmdlets de reuniones de PowerShell para obtener información sobre la configuración de la reunión.

Set-CsTeamsMeetingPolicy -Identity PolicyName -roomAttributeUserOverride Attribute -AllowTranscription $true

Nota

Si su perfil de voz no está disponible en la pestaña Reconocimiento de Configuración y no se le atribuyen transcripciones, vuelva a inscribir su perfil de voz.

Las siguientes son las directivas necesarias para establecer un altavoz inteligente y el reconocimiento de usuario.

Directiva Descripción Valores y comportamiento
roomAttributeUserOverride Controle la identificación de usuario basada en voz en las salas de reuniones. Esta configuración es necesaria para las cuentas de salas. Desactivado
  • El dispositivo de sala no enviará ancho de banda para guardar secuencias de audio desde la sala.
  • Los usuarios de las salas de reuniones no se atribuirán ni distinguirán, y sus firmas de voz no se recuperarán ni se usarán en absoluto.
  • Se desconocen los usuarios de las salas de reuniones.

Atributo
  • Los usuarios de salas se atribuirán en función de su estado de inscripción.
  • Los usuarios inscritos se muestran con su nombre en la transcripción.
  • Los usuarios que no están inscritos se muestran como oradores.

Distinguir
  • Los usuarios de las salas se distinguirán y separarán como altavoz 1, altavoz 2, .... orador en la transcripción.
  • Independientemente del estado de inscripción del usuario, su nombre no se mostrará en la transcripción.
AllowTranscription Necesario para las cuentas de usuario de BYOD y de salas de Teams. Verdadero y falso

En el Centro de administración de Teams, establezca la directiva de transcripción . La configuración está desactivada de forma predeterminada.

Nota

Después de asignar una directiva, pueden pasar hasta 48 horas en aplicarse. Para que la directiva surta efecto antes, es necesario cerrar la sesión de las cuentas y volver a iniciarla.

Configuraciones regionales de transcripción durante la reunión

Una vez que un usuario final se inscribe, su voz se puede reconocer durante las reuniones e identificarse en la transcripción cuando la reunión se establece en uno de los siguientes idiomas:

Inglés (Estados Unidos), inglés (Canadá), inglés (India), inglés (Reino Unido), inglés (Australia), inglés (Nueva Zelanda), árabe (Emiratos Árabes), árabe (Arabia Saudí), chino (China simplificada), chino (tradicional, Hong Kong RAE), chino (tradicional, Taiwán), checo (Checo), danés (Dinamarca), neerlandés (Bélgica), neerlandés (Países Bajos), francés (Canadá), francés (Francia), finlandés (Finlandia), alemán (Alemania), griego (Grecia), hebreo (Israel), hindi (India), húngaro (Hungría), italiano (Italia), Japonés (Japón), coreano (Corea), noruego (Noruega), polaco (Polonia), portugués (Brasil), portugués (Portugal), rumano (Rumania), ruso (Rusia), eslovaco (Eslovaquia), español (México), español (España), sueco (Suecia), tailandés (Tailandia), turco (Turquía), ucraniano (Ucrania), vietnamita (Vietnam), galés (Reino Unido)

Preguntas más frecuentes (P+F)

Revisa el documento de reconocimiento facial y de inscripción de voz si tienes más preguntas sobre el uso y el almacenamiento de datos del perfil de voz.

Artículo de soporte técnico: Usar altavoces inteligentes para identificar a los participantes en la sala