Compartilhar via


Ouça, Dont Just Recognize

[O Microsoft Agent foi preterido a partir do Windows 7 e pode estar indisponível nas versões subsequentes do Windows.]

A comunicação bem-sucedida envolve mais do que o reconhecimento de palavras. O processo de diálogo implica a troca de indicações para sinalizar a tomada de turnos e a compreensão. Os caracteres podem melhorar as interfaces de conversa, fornecendo indicações como inclinações de cabeça, nós ou shakes para indicar quando o mecanismo de fala está no estado de escuta e quando algo é reconhecido. Por exemplo, o Microsoft Agent reproduz animações atribuídas ao estado Escutando quando um usuário pressiona a tecla de escuta de conversa e animações atribuídas ao estado de Audição quando um enunciado é detectado. Ao definir seu próprio caractere, crie e atribua animações apropriadas a esses estados. Para obter mais informações sobre como criar caracteres, consulte Criando caracteres para o Microsoft Agent.

Além de indicações não verbais, uma conversa envolve um contexto comum entre as partes que conversam. Da mesma forma, cenários de entrada de fala com caracteres são mais propensos a ter êxito quando o contexto é bem estabelecido. Estabelecer o contexto permite que você interprete melhor frases semelhantes como "marcar está no email" e "marcar meu email". Talvez você também queira permitir que o usuário consulte o contexto fornecendo um comando, como "Ajuda" ou "Onde estou eu", ao qual você responde reafirmando o contexto atual, como a última ação executada pelo aplicativo.

O Microsoft Agent fornece interfaces que permitem que você acesse a melhor correspondência e as duas próximas melhores alternativas retornadas pelo mecanismo de reconhecimento de fala. Além disso, você pode acessar pontuações de confiança para todas as correspondências. Você pode usar essas informações para determinar melhor o que foi falado. Por exemplo, se as pontuações de confiança da melhor correspondência e a primeira alternativa estiverem próximas, isso poderá indicar que o mecanismo de fala teve dificuldade em discernir a diferença entre elas. Nesse caso, convém pedir ao usuário para repetir ou reformular a solicitação em um esforço para melhorar o desempenho. No entanto, se a melhor correspondência e a primeira ou a segunda alternativas retornarem o mesmo comando, ela fortalecerá a indicação do reconhecimento correto.

A natureza de uma conversa ou diálogo implica que deve haver uma resposta à entrada falada. Portanto, a entrada de um usuário sempre deve ser respondida com comentários verbais ou visuais que indicam que uma ação foi executada ou um problema foi encontrado ou fornece uma resposta apropriada.