Entender como fundamentar o seu modelo de linguagem

Concluído

Os modelos de linguagem se destacam na geração de texto envolvente e são ideais como base para copilotos. Os copilotos fornecem aos usuários um aplicativo intuitivo baseado em chat para receber assistência em seu trabalho. Ao projetar um copiloto para um caso de uso específico, você deseja garantir que seu modelo de linguagem seja fundamentado e use informações factuais relevantes para o que o usuário precisa.

Embora os modelos de linguagem sejam treinados em uma grande quantidade de dados, eles podem não ter acesso ao conhecimento que você deseja disponibilizar aos usuários. Para garantir que um copiloto seja fundamentado em dados específicos para fornecer respostas precisas e específicas do domínio, você pode usar a Geração Aumentada de Recuperação (RAG).

Noções básicas sobre o RAG

RAG é uma técnica que você pode usar para fundamentar um modelo de linguagem. Em outras palavras, é um processo para recuperar informações que são relevantes para o prompt inicial do usuário. Em termos gerais, o padrão RAG incorpora as seguintes etapas:

Diagrama do padrão de geração aumentada de recuperação.

  1. Recuperar dados de aterramento com base no prompt inicial inserido pelo usuário.
  2. Aumentar o prompt com dados de aterramento.
  3. Use um modelo de linguagem para gerar uma resposta fundamentada.

Ao recuperar o contexto de uma fonte de dados especificada, você garante que o modelo de linguagem use informações relevantes ao responder, em vez de depender de seus dados de treinamento.

O uso de RAG é uma técnica poderosa e fácil de usar para muitos casos em que você deseja fundamentar seu modelo de linguagem e melhorar a precisão factual das respostas do seu copiloto.

Adicionar dados de aterramento a um projeto de IA do Azure

Você pode usar o Estúdio de IA do Azure para criar um copiloto personalizado que use seus próprios dados para aterrar os prompts. O Estúdio de IA do Azure dá suporte a uma variedade de conexões de dados que você pode usar para adicionar dados a um projeto, incluindo:

  • Armazenamento de Blobs do Azure
  • Azure Data Lake Storage Gen2
  • Microsoft OneLake

Você também pode carregar arquivos ou pastas no armazenamento usado pelo seu projeto do Estúdio de IA.

Captura de tela da caixa de diálogo Adicionar dados no Estúdio de IA do Azure.