O que são modelos de machine learning?

Concluído

O modelo é o componente central do aprendizado de máquina e, em última análise, o que estamos tentando construir. Um modelo pode estimar a idade de uma pessoa a partir de uma foto, prever o que você gostaria de ver nas redes sociais ou decidir para onde um braço robótico deve se mover. No nosso cenário, queremos construir um modelo que possa estimar o melhor tamanho de bota para um cão com base no seu tamanho de arnês.

Os modelos podem ser construídos de várias maneiras. Por exemplo, um modelo tradicional que simula como um avião voa é construído por pessoas, usando conhecimentos de física e engenharia. Os modelos de aprendizagem automática são especiais; Em vez de serem editados por pessoas para que funcionem bem, os modelos de aprendizado de máquina são moldados por dados. Aprendem com a experiência.

Como pensar em modelos

Você pode pensar em um modelo como uma função que aceita dados como uma entrada e produz uma saída. Mais especificamente, um modelo usa dados de entrada para estimar outra coisa. Por exemplo, em nosso cenário, queremos criar um modelo que tenha um tamanho de arnês e estime o tamanho da inicialização:

Diagrama mostrando um modelo sem parâmetros.

O tamanho do arnês e o tamanho da bota do cão são dados; eles não fazem parte do modelo. O tamanho do arnês é a nossa entrada, o tamanho da bota do cão é a saída.

Os modelos são muitas vezes um código simples

Os modelos muitas vezes não são significativamente diferentes de funções simples com as quais você já está familiarizado. Como outros códigos, eles contêm lógica e parâmetros. Por exemplo, a lógica pode ser multiplicar o tamanho do arnês por parameter_1:

Um diagrama mostrando um modelo com um único parâmetro não especificado.

Se parameter_1 aqui fosse 2,5, nosso modelo multiplicaria o tamanho do arnês por 2,5 e devolveria o resultado:

Diagrama mostrando um modelo com 2,5 como único parâmetro.

Selecionar um modelo

Existem muitos tipos de modelos, alguns simples e outros complexos.

Como todo código, modelos mais simples são muitas vezes os mais confiáveis e fáceis de entender, enquanto modelos complexos podem potencialmente realizar feitos impressionantes. O tipo de modelo que você deve escolher depende do seu objetivo. Por exemplo, os cientistas médicos geralmente trabalham com modelos que são relativamente simples, porque são confiáveis e intuitivos. Por outro lado, os robôs baseados em IA normalmente dependem de modelos complexos.

O primeiro passo no aprendizado de máquina é selecionar o tipo de modelo que você gostaria de usar. Então, estamos escolhendo um modelo com base em sua lógica interna. Por exemplo, podemos selecionar um modelo de dois parâmetros para estimar o tamanho da bota do cão a partir do tamanho do arnês:

Diagrama mostrando um modelo com dois parâmetros não especificados.

Observe como selecionamos um modelo com base em como ele funciona logicamente, mas não com base em seus valores de parâmetro. Na verdade, neste momento, os parâmetros não foram definidos para nenhum valor específico.

Os parâmetros são descobertos durante o treinamento

O designer humano não seleciona valores de parâmetro. Em vez disso, os valores dos parâmetros são definidos como uma suposição inicial e, em seguida, ajustados durante um processo de aprendizagem automatizado chamado treinamento.

Dada a nossa seleção de um modelo de dois parâmetros, começamos por fornecer palpites aleatórios para os nossos parâmetros:

Diagrama mostrando um modelo com 0,2 e 1,2 como parâmetros.

Esses parâmetros aleatórios significam que o modelo não é bom em estimar o tamanho da bota, por isso realizamos treinamento. Durante o treino, estes parâmetros são automaticamente alterados para dois novos valores que dão melhores resultados:

Diagrama mostrando um modelo com 1,5 e 4 como parâmetros.

Exatamente como esse processo funciona é algo que explicamos progressivamente ao longo da sua jornada de aprendizagem.