Aprendizado de transferência

Concluído

Na vida, é normalmente mais fácil aprender uma habilidade nova quando você já tem experiência em outra semelhante e transferível. Por exemplo, é provavelmente mais fácil ensinar alguém a dirigir um ônibus quando a pessoa já sabe dirigir um carro. O motorista pode desenvolver as habilidades que aprendeu para dirigir um carro e aplicá-las para dirigir um ônibus.

O mesmo princípio pode ser aplicado ao treinamento de modelos de aprendizado profundo com uma técnica chamada transferência de aprendizado.

Como a transferência de aprendizado funciona?

Uma CNN (rede neural convolucional) de classificação de imagens é normalmente composta de várias camadas que extraem atributos e usam uma camada final totalmente conectada para classificar as imagens com base neles.

A CNN consisting of a set of feature extraction layers and a fully-connected prediction layer

Conceitualmente, essa rede neural consiste em dois conjuntos diferentes de camadas:

  1. Um conjunto de camadas do modelo de base que executa a extração de atributos.
  2. Uma camada totalmente conectada que usa os atributos extraídos para a previsão de classe.

As camadas de extração de atributos aplicam filtros convolucionais e pooling para enfatizar bordas, cantos e outros padrões nas imagens que podem ser usados para diferenciá-las e, em teoria, devem funcionar para qualquer conjunto de imagens com as mesmas dimensões que a camada de entrada da rede. A camada de previsão mapeia os atributos para um conjunto de saídas que representam probabilidades para cado rótulo de classe a ser usado na classificação das imagens.

Ao separar a rede nesses tipos de camadas, é possível acrescentar uma ou mais camadas de extração de atributos de um modelo que já foi treinado para usar os atributos extraídos na previsão dos rótulos de classe apropriados para suas imagens. Esta abordagem permite manter os pesos pré-treinados para as camadas de extração de atributos, o que significa que só é preciso treinar as camadas de previsão que você adicionou.

Há muitas arquiteturas de redes neurais convolucionais estabelecidas para a classificação de imagens que podem ser usadas como o modelo de base da transferência de aprendizado, a fim de criar facilmente um modelo eficaz de classificação de imagens com base no trabalho que já foi feito.