Partilhar via


Quid novi? (#4)

Já temos A MELHOR VOZ DE PORTUGAL!

Nos inícios de Fevereiro, o MLDC deu início a uma campanha de avaliação de vozes portuguesas destinada a seleccionar a MELHOR VOZ a ser integrada no nosso futuro sintetizador de fala (ou Text-to-Speech -TTS) em Português Europeu, o qual será desenvolvido pelo MLDC.

Esta voz será ouvida num futuro muito próximo, em produtos como: Exchange Unified Messaging e Office Communication Server – Speech Server, na área de fala telefónica para sistemas servidor, Voice Command na área de mobilidade, Windows Vistawave 7” e Windows Media Player, nas áreas de sistemas cliente.

O processo constou de 4 fases:

Fase 1: De um total de 490 candidatas iniciais, que responderam a um anúncio nacional, seleccionámos 74 com base em requisitos como: ser mulher, ter vivido e estudado em Portugal até ao nível universitário, falar a variedade do português standard, ter experiência de locução. Em seguida, pediu-se às candidatas que nos enviassem amostras da sua voz, exemplos de trabalhos publicitários que tenham feito, etc. 

Fase 2: A equipa do MLDC, constituída na altura por 7 elementos, avaliou as 74 vozes com base nos seguintes parâmetros subjectivos (muitos deles extraídos do Mean Opinion Score-MOS Test): agradabilidade, inteligibilidade, articulação, grau de presença de marca dialectal, expressividade, excepcionalidade, sensualidade e atitude, idade subjectiva da voz e velocidade. Três perguntas ainda procuravam perceber o impacto que uma dada voz tinha junto do potencial cliente em aplicações como leitura de e-mail, de notícias ou de instruções.

Fase 3:  De 74 vozes escolhemos, nesta fase, as 12 mais votadas, que foram convidadas a gravar um texto por nós escolhido, foneticamente rico e prosodicamente variado, no estúdio com quem trabalhamos, o Páteo das Cantigas. Esta gravação destinou-se a garantir que as vozes fossem registadas em condições de igualdade em relação ao texto e à qualidade técnica. As 12 vozes foram em seguida colocadas num survey, visando avaliar os parâmetros subjectivos das vozes, aberto a toda a Microsoft Portugal. 111 colegas da Microsoft Portugal votaram e obtivemos 4 finalistas com votações muito próximas.

Fase 4: Nesta fase, fizemos uma avaliação objectiva (isto é, algorítmica) de parâmetros acústicos destas 4 vozes finalistas. Esta análise foi conduzida por mim que, para o efeito, me desloquei ao Advanced Insitute of Technology (ATC) da Microsoft, em Pequim (China), no mês passado, onde realizou estudos de correlação entre os parâmetros objectivos e subjectivos para as 4 vozes finalistas (1, 4, 10 e 6). Foram considerados os seguintes parâmetros objectivos:

1. frequência fundamental

2. formantes (frequências) 1 e 2

3. largura de banda dos formantes 1 e 2

4. energia

5. débito

6. taxa de silêncios.

Da análise das 4 vozes finalistas do survey interno, segundo estes parâmetros e da correlação entre eles e os 6 parâmetros objectivos descritos, concluiu-se que a voz 10 é a que apresenta um índice de correlação mais forte. Este resultado foi também reforçado por um teste de ressíntese das vozes gravadas (manipulação de parâmetros acústicos, neste caso, a frequência fundamental e as durações), efectuado a um grupo de alunos universitários, dado que a voz 10 ocupou o segundo lugar (tendo ficado todas as outras 4 finalistas muito para trás na lista das 12).  Este teste mostrou mais uma vez a consensualidade dos resultados da voz 10 perante públicos diferentes e com um tipo de manipulação próximo do produzido na síntese.

Por todas estas razões, é com grande satisfação que vimos anunciar que a voz 10 será a Melhor Voz de Portugal (feminina) para os futuros sistemas de Text-to-Speech (TTS) da Microsoft, resultado que foi recebido com muito entusiasmo pela candidata seleccionada, que começará já a gravar no início de Junho próximo.

Ao longo deste processo todo, os meus agradecimentos especiais vão para as 12 finalistas que gentilmente se disponibilizaram para vir gravar e que demonstraram sempre um grande profissionalismo, qualidade e simpatia. Um grande beijinho para todas elas, muitas das quais ouvimos todos com prazer nas nossas rádios e televisões diariamente! Os meus agradecimentos também aos colegas da Microsoft Portugal que nos ajudaram a escolher a melhor voz de Portugal!

Posted by: Daniela Braga