Entender quando ajustar um modelo de fundação

Concluído

Usando modelos de base pré-treinados de código aberto, você pode economizar recursos. Às vezes, você pode precisar ajustar um modelo de fundação para atender às suas necessidades específicas.

Explore modelos de fundação no catálogo de modelos

Os modelos de base são grandes modelos de aprendizado de máquina que já são treinados para servir como base para uma ampla variedade de casos de uso.

No Azure Machine Learning, você pode explorar modelos de base de código aberto pesquisando no catálogo de modelos. O tipo de modelo de fundação que você precisa depende do que você deseja usar o modelo.

Em geral, os modelos de base são treinados em grandes quantidades de dados e se destacam em tarefas genéricas, como entender a linguagem, gerar texto e prever contexto. No entanto, eles podem não ser a melhor escolha se você precisar de um modelo adaptado a uma tarefa ou domínio específico. Nesses casos, ajustar o modelo básico em dados específicos da tarefa pode ajudar a atender aos seus requisitos específicos e alcançar melhores resultados.

Ajuste fino de modelos de base para tarefas específicas

Embora os modelos de fundação já possam satisfazer seus requisitos, pode ser necessário ajustar um modelo de fundação.

Os modelos de base são pré-treinados em uma gama diversificada de textos da internet, tornando-os proficientes na compreensão geral da linguagem. No entanto, o ajuste fino permite adaptar o conhecimento do modelo a uma tarefa ou domínio específico, otimizando seu desempenho e garantindo que ele se destaque naquele contexto específico.

Algumas tarefas comuns para as quais você pode querer ajustar um modelo de fundação são:

  • Classificação de texto: categorizar um determinado texto em classes ou categorias predefinidas com base no seu conteúdo ou contexto.
  • Classificação de tokens: atribuir rótulos ou tags específicos a tokens ou palavras individuais em um texto, geralmente usados em tarefas como reconhecimento de entidade nomeada.
  • Resposta a perguntas: Fornecer respostas precisas e relevantes a perguntas colocadas em linguagem natural.
  • Sumarização: Criação de resumos concisos e coerentes de textos mais longos, capturando as informações essenciais.
  • Tradução: Converter texto de um idioma para outro, preservando o significado e o contexto.

Como os modelos de fundação já estão pré-treinados, você precisa de um conjunto de dados específico de tarefa menor para ajustar um modelo de fundação. Quando você ajusta um modelo, é provável que precise de menos dados e computação do que quando treinaria um modelo do zero.

Você pode ajustar um modelo de base a partir do catálogo de modelos no Azure Machine Learning. Você só precisa de um pequeno conjunto de dados e um cluster de GPU para ajustar um modelo.