Partager via


Currente calamo (#5)

Balanço da I Microsoft Workshop on Speech Processing: building bridges between industry and academia

Foi a 2 de Maio, tal como anunciado, e correu optimamente (já o queria ter dito antes!). Na qualidade de organizadora e investida da difícil função de repórter, não podia deixar passar este evento em branco. Então, cá vai:

Pelas 9:30, o Director do MLDC, Prof. Miguel Sales Dias, abria o evento, contando um pouco da história do MLDC, agradecendo a presença de uma plateia tão interessante e convindando o público académico e industrial presente a fazer sugestões de projectos conjuntos com o MLDC na área da tecnologia da voz.

Seguiu-se o Pedro Silva, o nosso Lead Software Developer Engineer mostrando vários exemplos de aplicações em que é possível usar síntese e reconhecimento de fala em Português, muita na linha dos TechDays 07. A já famosa demo TalktoMe, que está na nossa página web, foi uma das protagonistas. Palavras para quê? As demos falam por si e o Pedro saiu-se muito bem.

O Prof. Carlos Teixeira, nosso ilustre convidado da Faculdade de Ciências com um longo curriculo na área, trouxe-nos um pouco da problemática da identificação da língua no reconhecimento de voz. Seguiram-se os nossos simpáticos estagiários, presentemente a concluir tese de mestrado e orientados pelo Prof. Carlos Teixeira. Primeiro, o Mário Henriques, que nos trouxe uma demo muito promissora do Media Center controlado por comandos de fala em Português; logo depois, a Carla Simões mostrou-nos um pouco mais do funcionamento dos modelos acústicos do Português.

O Prof. Luís Caldas Oliveira, investigador do INESC-ID e professor no IST, profusamente conhecido na área, trouxe-nos um curioso exemplo de integração da síntese da fala em Português num software educativo destinado a prevenir o bullying nas escolas.

O nosso Lead Software Test Engineer, António Calado, veio falar dos desafios da aquisição de um corpus telefónico em larga escala em Português para melhoria dos reconhecimento de fala em Português. 

A Engª Maria João Barros, professora do ISEL e investigadora no LSS -FEUP, apresentou-nos os últimos e interessantíssimos desenvolvimentos da adaptação da tecnologia do HTS à síntese da fala em Português, mostrando uma alternativa promissora na direcção da lnaturalidade da fala sintética. O João Freitas, orientado pela Engª Maria João Barros,  impressionou com a adaptação do reconhecimento e síntese da fala em Português às aplicações móveis, com o Voice Command.

O nosso último convidado chegou-nos do IEETA, da Universidade de Aveiro, assinalando o início de uma cooperação científica e instituicional com um dos nomes de destaque em processamento da fala em Portugal, o Prof. António Teixeira, que nos presenteou com o CARL, um robot inteligente comandado por voz, a meio caminho de falar Português.

E por último, com o fôlego possível de quem acaba de chegar de uma viagem profissional ao país do sol nascente, mas muito bem-disposta, falei eu a respeito da metodologia que desenvolvi para selecção de vozes a serem integradas em sistemas de conversão Texto-Fala, dos testes e parâmetros subjectivos e objectivos que considerei e dos resultados que obtive. 

A assistência, fantástica, vinda da indústria e da academia portuguesas, interveio assiduamente, questionando os oradores, dando sugestões, apontando linhas de colaboração entre várias instituições, alimentando debates profícuos. Estamos já em contacto com alguns participantes e aguardamos mais ideias de colabaoração dos demais. O nosso muito obrigado pelo vosso feed-back e pela vossa calorosa presença.

Como balanço final, concluí que, para a próxima, a nossa Workshop terá de ser mais alargada, com direito a vários intervalos e almoço, permitindo assim mais debate entre os presentes.

                 

Foi assim a nossa Workshop em Tecnologia da Fala, a primeira de um ciclo de muitas- esperemos, totalmente dedicada à tecnologia da fala em Português. Para o ano haverá mais, com agenda prevista para o Outono, na qual esperamos estreitar cada vez mais laços com a indústria e a academia portuguesas e alargar o ecossistema do processamento da fala em Português a outros territórios da lusofonia. 

Posted by: Daniela Braga