Introdução
A forma como treinamos modelos não é, de forma alguma, um processo perfeitamente automatizado. A dependência cega do treinamento em dados pode levá-lo a aprender coisas que não são úteis no final, ou a não aprender efetivamente coisas que são realmente úteis. O material de aprendizagem a seguir apresenta algumas razões simples pelas quais o underfitting e o overfitting ocorrem e o que você pode fazer a respeito.
Cenário: Treinamento de cães de resgate em avalanches
Ao longo deste módulo, usaremos o seguinte cenário de exemplo para explicar o underfitting e o overfitting. Este cenário foi projetado para fornecer um exemplo de como você pode atender a esses conceitos ao programar por conta própria. Tenha em mente que esses princípios geralmente se aplicam a quase todos os tipos de modelos, não apenas àqueles com os quais trabalhamos aqui.
É hora de sua instituição de caridade treinar uma nova geração de cães em como encontrar caminhantes varridos por avalanches. Há um debate no escritório sobre quais cães são melhores; Um cão grande é melhor do que um cão menor? Os cães devem ser treinados quando são jovens ou quando estão mais maduros? Felizmente, você tem estatísticas sobre resgates realizados nos últimos anos que você pode olhar. Treinar cães é caro, no entanto, e você precisa ter certeza de que seus critérios de escolha de cães são sólidos.
Pré-requisitos
- Familiaridade com modelos de aprendizagem automática
Objetivos de aprendizagem
Neste módulo, irá:
- Defina a normalização de recursos.
- Crie e trabalhe com conjuntos de dados de teste.
- Articular como os modelos de teste podem melhorar e prejudicar o treinamento.