Definir o aprendizado supervisionado

Concluído

O processo de treinamento de modelo pode ser supervisionado ou não supervisionado. Nossa meta é contrastar essas abordagens e, em seguida, nos aprofundarmos no processo de aprendizado, com foco no aprendizado supervisionado. Vale a pena lembrar ao longo desta discussão que a única diferença entre o aprendizado supervisionado e não supervisionado é como a função de objetivo funciona.

O que é aprendizado não supervisionado?

No aprendizado não supervisionado, treinamos um modelo para resolver um problema sem sabermos a resposta correta. Na verdade, o aprendizado não supervisionado normalmente é usado para problemas em que não há uma resposta correta, mas sim soluções melhores e piores.

Imagine que queremos que nosso modelo de machine learning gere imagens realistas de cachorros de resgate de avalanche. Não há um desenho "correto" a ser desenhado. Ficaremos satisfeitos se a imagem for um pouco semelhante a um cachorro. Mas se a imagem produzida for de um gato, essa será uma solução pior.

Lembre-se de que o treinamento requer vários componentes:

Diagrama das partes de modelo e objetivo da função do ciclo de vida de machine learning.

No aprendizado não supervisionado, a função de objetivo faz o julgamento unicamente em relação à estimativa do modelo. Isso significa que geralmente a função de objetivo precisa ser relativamente sofisticada. Por exemplo, a função de objetivo pode precisar conter um "detector de cachorros" para avaliar se as imagens que o modelo gera são realistas. Os únicos dados necessários para o aprendizado não supervisionado são sobre os recursos que fornecemos ao modelo.

O que é aprendizado supervisionado?

O aprendizado supervisionado pode ser compreendido como um aprendizado por exemplo. No aprendizado supervisionado, avaliamos o desempenho do modelo comparando suas estimativas com a resposta correta. Embora seja possível ter funções de objetivo muito simples, o seguinte é necessário:

  • Recursos fornecidos como entradas para o modelo
  • Rótulos, que são as respostas corretas que queremos que o modelo seja capaz de produzir

Diagrama das partes de modelo e de função de objetivo do ciclo de vida de machine learning, com rótulos.

Por exemplo, considere nosso desejo de prever qual será a temperatura em 31 de janeiro de um determinado ano. Para essa previsão, precisamos de dados com dois componentes:

  • Recurso: data
  • Rótulo: temperatura diária (por exemplo, com base em registros históricos)

No cenário, fornecemos o recurso de data para o modelo. O modelo prevê a temperatura e comparamos esse resultado com a temperatura "correta" do conjunto de dados. Depois, a função de objetivo pode calcular o desempenho do modelo e podemos fazer ajustes.

Os rótulos são apenas para aprendizado

É importante lembrar que, independentemente de como os modelos são treinados, eles só processam recursos. Durante o aprendizado supervisionado, a função de objetivo é o único componente que depende do acesso aos rótulos. Após o treinamento, não precisamos de rótulos para usar o modelo.