Definir aprendizagem supervisionada
O processo de formação de um modelo pode ser supervisionado ou não supervisionado. Nosso objetivo é contrastar essas abordagens e, em seguida, mergulhar mais profundamente no processo de aprendizagem com foco na aprendizagem supervisionada. Vale lembrar ao longo desta discussão que a única diferença entre aprendizagem supervisionada e não supervisionada é como funciona a função objetiva.
O que é a aprendizagem não supervisionada?
Na aprendizagem não supervisionada, treinamos um modelo para resolver um problema sem sabermos a resposta correta. Na verdade, a aprendizagem não supervisionada é normalmente usada para problemas em que não há uma resposta correta, mas, em vez disso, melhores e piores soluções.
Imagine que queremos que o nosso modelo de aprendizagem automática desenhe imagens realistas de cães de resgate em avalanches. Não há um desenho "correto" para desenhar. Desde que a imagem se pareça um pouco com um cão, estamos satisfeitos. Mas se a imagem produzida for de um gato, essa é uma solução pior.
Lembre-se que a formação requer várias componentes:
Na aprendizagem não supervisionada, a função objetiva faz seu julgamento puramente sobre a estimativa do modelo. Isso significa que a função objetiva muitas vezes precisa ser relativamente sofisticada. Por exemplo, a função objetiva pode precisar conter um "detetor de cães" para avaliar se as imagens que o modelo desenha parecem realistas. Os únicos dados de que precisamos para a aprendizagem não supervisionada são sobre os recursos que fornecemos ao modelo.
O que é a aprendizagem supervisionada?
Pense na aprendizagem supervisionada como uma aprendizagem pelo exemplo. Na aprendizagem supervisionada, avaliamos o desempenho do modelo comparando suas estimativas com a resposta correta. Embora possamos ter funções objetivas simples, precisamos de ambas:
- Recursos que são fornecidos como entradas para o modelo
- Rótulos, que são as respostas corretas que queremos que o modelo seja capaz de produzir
Por exemplo, considere nosso desejo de prever qual será a temperatura em 31 de janeiro de um determinado ano. Para esta previsão, precisamos de dados com dois componentes:
- Desenho: Data
- Gravadora: Temperatura diária (por exemplo, de registros históricos)
No cenário, fornecemos o recurso de data para o modelo. O modelo prevê a temperatura, e comparamos esse resultado com a temperatura "correta" do conjunto de dados. A função objetiva pode então calcular o quão bem o modelo funcionou, e podemos fazer ajustes no modelo.
Os rótulos são apenas para aprender
É importante lembrar que, não importa como os modelos são treinados, eles apenas processam recursos. Durante a aprendizagem supervisionada, a função objetiva é a única componente que depende do acesso a rótulos. Após o treinamento, não precisamos de rótulos para usar nosso modelo.