Qual modelo usar

3 minutos

Há muitos fatores, incluindo custo, disponibilidade, desempenho e capacidade, a serem considerados ao escolher qual LLM usar. Geralmente, recomendamos os seguintes guias:

gpt-35-turbo: Este modelo é econômico, tem um bom desempenho e, apesar do nome ChatGPT, pode ser usado para uma ampla gama de tarefas além de bate-papo e conversa.
gpt-35-turbo-16k, gpt-4 ou gpt-4-32k: Estes modelos são uma boa escolha se você precisar gerar mais de 4.096 tokens ou precisar suportar prompts maiores. No entanto, estes modelos são mais caros, podem ser mais lentos e podem ter disponibilidade limitada.
Modelos de incorporação: se suas tarefas incluírem pesquisa, clustering, recomendações e deteção de anomalias, você deverá usar um modelo de incorporação. Os computadores podem facilmente utilizar um vetor de números que formam a incorporação. A incorporação é uma representação densa em informações do significado semântico de um pedaço de texto. A distância entre duas incorporações no espaço vetorial está correlacionada com a semelhança semântica. Por exemplo, se dois textos são semelhantes, então suas representações vetoriais também são semelhantes.
DALL-E: Este modelo gera imagens a partir de prompts de texto. DALL-E difere de outros modelos de linguagem porque sua saída é uma imagem, não texto.
Whisper: Este modelo é treinado em um grande conjunto de dados de áudio e texto em inglês. O Whisper é otimizado para recursos de fala para texto, como transcrever arquivos de áudio. Ele pode ser usado para transcrever arquivos de áudio que contêm fala em outros idiomas além do inglês, mas a saída do modelo é texto em inglês. Use o Whisper para transcrever rapidamente arquivos de áudio um de cada vez, traduzir áudio de outros idiomas para o inglês ou fornecer sua solicitação ao modelo para guiar a saída.

Qual modelo usar

Comentários