Ser eficiente e natural
[O Microsoft Agent foi preterido a partir do Windows 7 e pode estar indisponível nas versões subsequentes do Windows.]
Ao realizar tarefas, conversas humanas eficazes normalmente são trocas de informações breves. Muitas vezes, os elementos na discussão são estabelecidos entre as partes e, em seguida, referenciados indiretamente usando respostas abreviadas. Essas formas de abreviação são benéficas porque são eficientes e também implicam que o locutor e o ouvinte têm um contexto comum; ou seja, que eles estão se comunicando. O uso de formas apropriadas de abreviação também torna um diálogo mais natural.
Uma forma de abreviação de conversa é o uso de contrações. Quando eles não são usados, eles fazem um orador parecer mais formal e rígido, e às vezes menos humano. A maioria das conversas humanas demonstra mais liberdade nas regras linguísticas do que o texto escrito.
Outra forma comum de abreviação em conversas é anaphora, o uso de pronomes. Por exemplo, quando alguém pergunta: "Você viu Bill hoje?" respostas que substituem "ele" por "Bill" são mais naturais do que repetir o nome novamente. A substituição é uma indicação de que as partes no diálogo compartilham um contexto comum de quem é "ele". Tenha em mente que a palavra "I" se refere ao personagem quando ele ou ela diz isso.
O contexto compartilhado também é comunicado pelo uso de reticências linguísticas, o truncamento de muitas das palavras na consulta original. Por exemplo, o ouvinte poderia responder, "Sim, eu o vi", demonstrando o contexto compartilhado de quando ou até mesmo responder com um simples "Sim" que demonstra o contexto compartilhado de quem e quando.
A compreensão implícita também pode ser transmitida por meio de outras formas de estilo de conversa abreviado, em que o conteúdo é inferido sem repetição, conforme mostrado no exemplo a seguir:
Usuário: Eu gostaria de uma pizza estilo Chicago.
Caractere: Com "Queijo Extra"?
Da mesma forma, se alguém diz: "Está quente aqui", a frase é compreensível e não requer mais detalhes se você sabe onde está o orador. No entanto, se o contexto não estiver bem estabelecido ou for ambíguo, eliminar todas as referências contextuais poderá deixar o usuário confuso.
Ao usar a comunicação abreviada, sempre considere o contexto do usuário e o tipo de conteúdo. É apropriado usar descrições mais longas para informações novas e desconhecidas. No entanto, mesmo com informações descritivas longas, tente dividi-la em partes menores. Isso oferece a capacidade de alterar a animação à medida que o caractere fala. Ele também oferece maior oportunidade para o usuário interromper o caractere, especialmente ao usar a entrada de fala.
A consistência é importante na saída da fala. Padrões de fala estranhos ou prosódia podem ser interpretados como downgrade da inteligência do caractere. Da mesma forma, alternar entre o TTS e a fala gravada pode fazer com que os usuários interpretem o caractere como estranho ou possua mais de uma personalidade. Os movimentos da boca sincronizados com os lábios podem melhorar a inteligibilidade da fala. O Microsoft Agent dá suporte automaticamente à sincronização labial para mecanismos TTS que estão em conformidade com suas interfaces SAPI necessárias. No entanto, a sincronização labial também tem suporte para fala gravada. Os arquivos de som também podem ser aprimorados com a Ferramenta de Edição de Som Linguístico da Microsoft.