Resumo
Concluímos nossa introdução à classificação, então vamos recapitular alguns pontos-chave.
Vimos que a classificação tem muito em comum com a regressão clássica. Para ambos, podemos usar a aprendizagem supervisionada, uma função de custo, e usar conjuntos de dados de teste e treinamento para estimar o desempenho no mundo real. Nós nos concentramos aqui na regressão logística, que é quase um híbrido entre esses dois tipos de modelo, e mostramos como o limiar da saída nos dá um rótulo categórico, como avalanche
/no-avalanche
.
Discutimos como avaliar modelos de classificação pode ser um pouco mais difícil do que com modelos de regressão, particularmente porque as funções de custos envolvidas são muitas vezes pouco intuitivas.
Também exploramos como adicionar e combinar recursos poderia resultar em melhorias substanciais no modelo. É importante ressaltar que mostramos como realmente pensar sobre o que seus dados significam é a chave para alcançar o melhor resultado.
Neste módulo, trabalhamos com regressão logística. Mas tenha em mente que a maioria dos assuntos que abordamos aqui se aplicam a muitos outros tipos de modelos de classificação também. Incluindo modelos que tentam prever mais de duas categorias possíveis.