Como usar um modelo

Concluído

Vamos revisar como essas partes se encaixam para treinar um modelo.

Treinamento vs. uso de um modelo

É importante reforçar a distinção entre o treinamento e o uso de um modelo.

Usar um modelo significa fornecer entradas e receber uma estimativa ou uma previsão como saída. Usamos esse processo quando estamos treinando nosso modelo e quando nós ou nossos clientes o utilizamos no mundo real. O uso de um modelo normalmente leva poucos segundos.

Diagrama que mostra um modelo de aprendizado de máquina com dados entrando no modelo, que então passa por uma estimativa.

Por outro lado, o treinamento de um modelo é o processo de melhorar o quão bem um modelo funciona. O treinamento exige que usemos o modelo, a função objetiva e o otimizador em um loop especial. O treinamento pode levar minutos ou dias para ser concluído. Normalmente, treinamos um modelo apenas uma vez. Uma vez treinado, podemos usá-lo quantas vezes for necessário sem fazer alterações.

Diagrama do treinamento final, mostrando o ciclo de vida do modelo de aprendizado de máquina.

Por exemplo, em nosso cenário de loja de cães de resgate em avalanches, queremos treinar um modelo, usando um conjunto de dados públicos. O conjunto de dados altera o modelo para que ele possa prever o tamanho da bota de um cão com base no tamanho de seu arreio. Uma vez treinado, utilizamos o modelo como parte do nosso repositório online para verificar se os clientes estão comprando botas para cães que sirvam em seus cães.

Dados para uso, dados para treinamento

Lembre-se de que um conjunto de dados é uma coleção de informações sobre objetos ou coisas. Por exemplo, um conjunto de dados pode conter informações sobre cães:

ID do cão Tamanho da bota Tamanho do cinto Cor do cachorro Raça
0 27 12 Brown São Bernardo
1 26 11 Preto Labrador
2 25 10 Branca Labrador
3 29 14 Preto Pastor Alemão Negro

Quando usamos nosso modelo, precisamos apenas das colunas de dados que o modelo aceita como entrada. Essas colunas são chamadas de recursos. Em nosso cenário, se nosso modelo aceitar o tamanho do arreio e estimar o tamanho da bota, então nosso recurso será o tamanho do arreio.

Durante o treinamento, a função objetiva geralmente precisa conhecer o resultado do modelo e qual é a resposta correta. Esses valores são chamados de rótulos. No nosso cenário, se o nosso modelo prevê o tamanho da bota, então tamanho da bota é o nosso rótulo.

Portanto, para utilizar um modelo, precisamos apenas de recursos, enquanto durante o treinamento geralmente precisamos de recursos e rótulos. Durante o treinamento em nosso cenário, precisamos tanto do recurso tamanho do cinto quanto do rótulo tamanho da bota. Quando usamos nosso modelo em nosso site, só precisamos saber o recurso de tamanho do arreio; nosso modelo então estima o tamanho da bota que deve ser utilizada.

Terminei o treinamento. O que vem em seguida?

Depois que o modelo termina o treinamento, você pode salvá-lo em arquivo por si só. Não precisamos mais dos dados originais, da função objetiva ou do otimizador do modelo. Quando quisermos usar o modelo, podemos carregá-lo do disco, fornecer a ele novos dados e obter a previsão desejada.

No nosso próximo exercício, praticaremos como salvar um modelo, carregá-lo do disco e utilizá-lo como faríamos no mundo real. Para completar o cenário de nossa loja online, também praticamos o uso dos resultados do modelo para avisar os clientes se eles parecem estar comprando botas de cachorro do tamanho errado.