Compreender o ciclo de vida de desenvolvimento de um aplicativo LLM (modelo de linguagem grande)

Concluído

Antes de entender como trabalhar com fluxo imediato, vamos explorar o ciclo de vida de desenvolvimento de um aplicativo LLM (Large Language Model).

O ciclo de vida consiste nas seguintes etapas:

Diagram of the four stages of the development lifecycle.

  1. Inicialização: Defina o caso de uso e projete a solução.
  2. Experimentação: Desenvolver um fluxo e testar com um pequeno conjunto de dados.
  3. Avaliação e refinamento: Avalie o fluxo com um conjunto de dados maior.
  4. Produção: Implantar e monitorar o fluxo e a aplicação.

Durante a avaliação, o refinamento e a produção, você pode achar que sua solução precisa ser melhorada. Você pode voltar para a experimentação durante a qual você desenvolve seu fluxo continuamente, até que você esteja satisfeito com os resultados.

Vamos explorar cada uma dessas fases com mais detalhes.

Inicialização

Imagine que você deseja projetar e desenvolver um aplicativo LLM para classificar artigos de notícias. Antes de começar a criar qualquer coisa, você precisa definir quais categorias deseja como saída. Você precisa entender como é um artigo de notícias típico, como você apresenta o artigo como entrada para seu aplicativo e como o aplicativo gera a saída desejada.

Em outras palavras, durante a inicialização, você:

Diagram of the four steps during initialization.

  1. Definir o objetivo
  2. Coletar um conjunto de dados de exemplo
  3. Criar um prompt básico
  4. Projetar o fluxo

Para projetar, desenvolver e testar um aplicativo LLM, você precisa de um conjunto de dados de exemplo que sirva como entrada. Um conjunto de dados de exemplo é um pequeno subconjunto representativo dos dados que você eventualmente espera analisar como entrada para seu aplicativo LLM.

Ao coletar ou criar o conjunto de dados de exemplo, você deve garantir a diversidade nos dados para cobrir vários cenários e casos de borda. Você também deve remover qualquer informação confidencial de privacidade do conjunto de dados para evitar vulnerabilidades.

Experimentação

Você coletou um conjunto de dados de amostra de artigos de notícias e decidiu em quais categorias deseja que os artigos sejam classificados. Você projetou um fluxo que usa um artigo de notícias como entrada e usa um LLM para classificar o artigo. Para testar se o fluxo gera a saída esperada, execute-o no conjunto de dados de exemplo.

Diagram of the four steps during experimentation.

A fase de experimentação é um processo iterativo durante o qual você (1) executa o fluxo em relação a um conjunto de dados de exemplo. Em seguida, você (2) avalia o desempenho do prompt. Se você estiver (3) satisfeito com o resultado, você pode passar para a avaliação e refinamento. Se você acha que há espaço para melhorias, você pode (4) modificar o fluxo alterando o prompt ou o próprio fluxo.

Avaliação e aperfeiçoamento

Quando estiver satisfeito com a saída do fluxo que classifica artigos de notícias, com base no conjunto de dados de exemplo, você poderá avaliar o desempenho do fluxo em relação a um conjunto de dados maior.

Ao testar o fluxo em um conjunto de dados maior, você pode avaliar o quão bem o aplicativo LLM generaliza para novos dados. Durante a avaliação, você pode identificar possíveis gargalos ou áreas para otimização ou refinamento.

Ao editar seu fluxo, você deve primeiro executá-lo em um conjunto de dados menor antes de executá-lo novamente em um conjunto de dados maior. Testar seu fluxo com um conjunto de dados menor permite que você responda mais rapidamente a quaisquer problemas.

Quando seu aplicativo LLM parecer robusto e confiável ao lidar com vários cenários, você poderá decidir mover o aplicativo LLM para produção.

Produção

Finalmente, seu aplicativo de classificação de artigos de notícias está pronto para produção.

Diagram of the three steps during production.

Durante a produção, você:

  1. Otimize o fluxo que classifica os artigos recebidos para eficiência e eficácia.
  2. Implante seu fluxo em um ponto de extremidade. Quando você chama o ponto de extremidade, o fluxo é acionado para ser executado e a saída desejada é gerada.
  3. Monitore o desempenho de sua solução coletando dados de uso e feedback do usuário final. Ao entender como o aplicativo funciona, você pode melhorar o fluxo sempre que necessário.

Explore o ciclo de vida completo do desenvolvimento

Agora que você entende cada estágio do ciclo de vida de desenvolvimento de um aplicativo LLM, pode explorar a visão geral completa:

Diagram of all stages including their steps of the development lifecycle.