Verificação de conhecimentos

Concluído
1.

Você tem um conjunto específico de perguntas que deseja garantir que seu aplicativo de chat responda corretamente. Qual a melhor avaliação para verificar isso?

2.

Qual modelo de benchmark quantifica a semelhança semântica entre uma fonte de base e a resposta gerada?

3.

Você deseja avaliar o quão bem o texto gerado adere às regras gramaticais. Que tipo de avaliação seria melhor utilizar?