Introdução
Os modelos de base, como GPT-4, são modelos de processamento de linguagem natural de última geração projetados para entender, gerar e interagir com a linguagem humana. Para entender a importância dos modelos de base, é essencial explorar suas origens, que decorrem de avanços no campo de processamento de linguagem natural.
Noções básicas sobre o processamento de idioma natural
O NLP (processamento de linguagem natural) é um tipo de IA (inteligência artificial) que se concentra na compreensão, interpretação e geração de linguagem humana. Alguns casos de uso comuns do NLP incluem:
- Conversão de fala em texto e conversão de texto em fala. Por exemplo, gerar legendas para vídeos.
- Tradução automática. Por exemplo, traduzir texto do inglês para o japonês.
- Classificação de textos. Por exemplo, rotular um email como spam ou não spam.
- Extração de entidade. Por exemplo, extrair palavras-chave ou nomes de um documento.
- Resumo de texto. Por exemplo, gerar um resumo curto de um parágrafo de um documento de várias páginas.
- Respostas às perguntas. Por exemplo, forneça respostas a perguntas como "Qual é a capital da França?"
Observação
Neste módulo, você se concentra em explorar os modelos de base usados para resposta a perguntas. Os modelos de base que você explora podem ser usados para aplicativos de chat nos quais você usa um modelo de linguagem para gerar uma resposta à pergunta de um usuário.
Entender a importância da arquitetura de Transformador
O último avanço no processamento de linguagem natural (NLP) deve-se ao desenvolvimento da arquitetura de transformador.
Os transformadores foram introduzidos no artigo Attention Is All You Need de Vaswani e outros, de 2017. A arquitetura de Transformador forneceu duas inovações ao NLP que resultaram no surgimento de modelos de base:
- Em vez de processar palavras sequencialmente, os Transformadores processam cada palavra de maneira independente e paralela usando a atenção.
- Além da similaridade semântica entre palavras, os Transformadores usam codificação posicional para incluir as informações sobre a posição de uma palavra em uma frase.
Os modelos de base projetados para casos de uso de NLP geralmente são chamados de LLMs (Modelos de Linguagem Grandes) ou modelos de linguagem. Neste módulo, você explorará os modelos de linguagem disponíveis, como selecionar um modelo para seu caso de uso e como usar um modelo de linguagem com a Azure AI Foundry. Você se concentra em modelos de linguagem que ajudam você a desenvolver aplicativos de IA generativa que servem como aplicativos de chat, que por sua vez respondem a perguntas dos seus usuários.