Não há mais suporte para esse navegador.
Atualize o Microsoft Edge para aproveitar os recursos, o suporte técnico e as atualizações de segurança mais recentes.
Por que limpamos nossos dados antes do treinamento?
Remover linhas de dados torna nosso modelo mais poderoso.
A limpeza de dados nos ajuda a selecionar recursos que auxiliam no desempenho do modelo.
Remover linhas com erros evita que essas linhas enganem o processo de treinamento.
Que tipo de dados são mais bem codificados com vetores one-hot?
Dados ordinais
Dados categóricos com dois valores possíveis
Dados categóricos com três ou mais valores
O que é uma amostra de dados? O que é uma população?
Um exemplo são todos os dados possíveis que são relevantes para nós. Uma população é o subconjunto de dados que realmente temos em mãos.
População e amostra referem-se aos dados que usamos para treinar nosso modelo.
Uma população consiste em todos os dados possíveis que são relevantes para nós. Um exemplo é o subconjunto dos dados que de fato temos disponíveis.
Você tem um modelo que não tem um bom desempenho. Qual dessas opções definitivamente não ajuda a melhorar seu desempenho?
Adicionando mais amostras (linhas).
Adicionar alguns recursos (colunas) que você sabe que se relacionam com o que o modelo está tentando prever.
Adicionar um grande número de recursos que você sabe que não estão relacionados ao que o modelo está tentando prever.
É necessário responder a todas as perguntas antes de verificar o trabalho.
Esta página foi útil?