Entender quando ajustar um modelo de base
Usando modelos de base pré-treinados de código aberto, você pode salvar recursos. Às vezes, pode ser necessário ajustar um modelo de base para atender às suas necessidades específicas.
Explorar os modelos de base no catálogo de modelos
Modelos de base são modelos de machine learning grandes que já foram treinados para servir como base para uma ampla variedade de casos de uso.
No Azure Machine Learning, você pode explorar modelos de base de código aberto pesquisando no catálogo de modelos. O tipo de modelo de base de que você precisa depende da finalidade com que você deseja usar o modelo.
Em geral, modelos de base são treinados em grandes quantidades de dados e são excelentes para a realização de tarefas genéricas, como entender linguagem, gerar texto e prever contexto. No entanto, eles podem não ser a melhor opção se você precisa de um modelo adaptado a uma tarefa ou domínio específico. Nesses casos, ajustar o modelo de base usando dados específicos da tarefa pode ajudar a atender aos seus requisitos específicos e obter melhores resultados.
Ajustar modelos de base para tarefas específicas
Embora os modelos de base já possam atender aos seus requisitos, talvez seja necessário ajustar um deles.
Modelos de base são pré-treinados em uma variedade diversificada de textos da Internet, tornando-os proficientes no reconhecimento de linguagem geral. No entanto, o ajuste permite que você adapte o conhecimento do modelo para uma tarefa ou domínio específico, otimizando seu desempenho e garantindo que ele se destaque nesse contexto específico.
Algumas tarefas comuns para as quais você pode querer ajustar um modelo de base são:
- Classificação de texto: categorizar um determinado texto em classes ou categorias predefinidas com base no conteúdo ou contexto.
- Classificação de token: atribuir rótulos ou marcas específicos a tokens ou palavras individuais em um texto, geralmente usado em tarefas como reconhecimento de entidade nomeada.
- Respostas às perguntas: fornecer respostas precisas e relevantes para perguntas feitas em linguagem natural.
- Resumo: criar resumos concisos e coerentes de textos mais longos, capturando as informações essenciais.
- Tradução: converter texto de um idioma em outro preservando o significado e o contexto.
Como os modelos de base já são pré-treinados, você precisa de um conjunto de dados menor, específico da tarefa, para ajustar um modelo de base. Ao ajustar um modelo, é provável que você precise de menos dados e computação do que quando treinaria um modelo do zero.
Você pode ajustar um modelo de base do catálogo de modelos no Azure Machine Learning. Você só precisa de um pequeno conjunto de dados e de um cluster de GPU para ajustar um modelo.