Este browser já não é suportado.
Atualize para o Microsoft Edge para tirar partido das mais recentes funcionalidades, atualizações de segurança e de suporte técnico.
Por que limpamos nossos dados antes do treinamento?
A remoção de linhas de dados torna o nosso modelo mais poderoso.
A limpeza de dados nos ajuda a selecionar recursos que ajudam no desempenho do modelo.
A remoção de linhas com erros evita que essas linhas induzam em erro o processo de treinamento.
Que tipo de dados são melhor codificados com vetores one-hot?
Dados ordinais
Dados categóricos com dois valores possíveis
Dados categóricos com três ou mais valores
O que é uma amostra de dados? O que é uma população?
Uma amostra são todos os dados possíveis que nos interessam. Uma população é o subconjunto desses dados que realmente temos em mãos.
Tanto a população quanto a amostra referem-se a dados que usamos para treinar nosso modelo.
Uma população é todos os dados possíveis que nos interessam. Uma amostra é o subconjunto desses dados que realmente temos em mãos.
Você tem um modelo que não funciona bem. Qual dessas opções definitivamente não ajuda a melhorar seu desempenho?
Adicionar mais amostras (linhas).
Adicionar alguns recursos (colunas) que você sabe que estão relacionados ao que o modelo está tentando prever.
Adicionar um grande número de recursos que você sabe não tem relação com o que o modelo está tentando prever.
Tem de responder a todas as questões antes de verificar o seu trabalho.
Esta página foi útil?