Introdução
Modelos básicos, como o GPT-4, são modelos de processamento de linguagem natural de última geração projetados para entender, gerar e interagir com a linguagem humana. Para entender o significado dos modelos de fundação, é essencial explorar suas origens, que decorrem dos avanços no campo do processamento de linguagem natural.
Compreender o processamento de linguagem natural
O processamento de linguagem natural (PNL) é um tipo de inteligência artificial (IA) que se concentra na compreensão, interpretação e geração da linguagem humana. Alguns casos de uso comuns de PNL são:
- Conversão de fala para texto e de texto para fala. Por exemplo, gere legendas para vídeos.
- Tradução automática. Por exemplo, traduza texto do inglês para o japonês.
- Classificação do texto. Por exemplo, rotule um e-mail como spam ou não spam.
- Extração de entidades. Por exemplo, extraia palavras-chave ou nomes de um documento.
- Resumo do texto. Por exemplo, gere um breve resumo de um parágrafo a partir de um documento de várias páginas.
- Resposta à pergunta. Por exemplo, forneça respostas a perguntas como "Qual é a capital da França?"
Nota
Neste módulo, você se concentra em explorar modelos básicos usados para responder a perguntas. Os modelos de base que você explora podem ser usados para aplicativos de bate-papo nos quais você usa um modelo de linguagem para gerar uma resposta à pergunta de um usuário.
Entenda a importância da arquitetura do Transformer
O mais recente avanço no Processamento de Linguagem Natural (PNL) deve-se ao desenvolvimento da arquitetura Transformer .
Os transformadores foram introduzidos no artigo Attention is all you need por Vaswani, et al., de 2017. A arquitetura Transformer proporcionou duas inovações à PNL que resultaram no surgimento de modelos de fundação:
- Em vez de processar palavras sequencialmente, os Transformers processam cada palavra de forma independente e em paralelo usando a atenção.
- Ao lado da semelhança semântica entre palavras, os Transformers usam codificação posicional para incluir as informações sobre a posição de uma palavra em uma frase.
Os modelos de base projetados para casos de uso de PNL são frequentemente chamados de Large Language Models (LLMs) ou modelos de linguagem. Neste módulo, você explora os modelos de idioma disponíveis, como selecionar um modelo para seu caso de uso e como usar um modelo de linguagem com o portal do Azure AI Foundry. Você se concentra em modelos de linguagem que ajudam a desenvolver aplicativos de IA generativa que servem como aplicativos de bate-papo que respondem a perguntas, respondendo perguntas para seus usuários.