Descubra novos modelos de regressão
Na Unidade 2, analisámos a adequação de uma linha reta aos pontos de dados. No entanto, a regressão pode se encaixar em muitos tipos de relações, incluindo aquelas com múltiplos fatores e aquelas em que a importância de um fator depende de outro.
Experimentando modelos
Os modelos de regressão são frequentemente escolhidos porque trabalham com pequenas amostras de dados, são robustos, fáceis de interpretar e existe uma variedade.
A regressão linear é a forma mais simples de regressão, sem limite para o número de recursos usados. A regressão linear vem em muitas formas, muitas vezes nomeadas pelo número de características usadas e pela forma da curva que se encaixa.
As árvores de decisão adotam uma abordagem passo a passo para prever uma variável. Se pensarmos no nosso exemplo de bicicleta, a árvore de decisão pode ser primeiro exemplos divididos entre aqueles que estão durante a primavera/verão e outono/inverno, faça uma previsão com base no dia da semana. A segunda-feira de primavera/verão-segunda-feira pode ter uma taxa de aluguer de bicicletas de 100 por dia, enquanto a segunda-feira de outono/inverno-segunda-feira pode ter uma taxa de aluguer de 20 por dia.
Os algoritmos do Ensemble constroem não apenas uma árvore de decisão, mas um grande número de árvores, permitindo melhores previsões sobre dados mais complexos. Os algoritmos Ensemble, como o Random Forest, são amplamente utilizados em aprendizado de máquina e ciência de dados devido às suas fortes habilidades de previsão.
Os cientistas de dados geralmente experimentam o uso de modelos diferentes. No exercício a seguir, experimentaremos diferentes tipos de modelos para comparar o desempenho deles nos mesmos dados.