Importância do recurso de permuta
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Calcula as pontuações de importância de recurso de permutação de variáveis de recurso considerando um modelo treinado e um conjunto de dados de teste
Categoria: Módulos de Seleção de Recursos
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
Este artigo descreve como usar o módulo Importância do Recurso de Permutação no Machine Learning Studio (clássico) para calcular um conjunto de pontuações de importância do recurso para seu conjunto de dados. Use essas pontuações para ajudar a determinar os melhores recursos a serem usados em um modelo.
Neste módulo, os valores de recurso são aleatórias aleatoriamente, uma coluna por vez e o desempenho do modelo é medido antes e depois. Você pode escolher uma das métricas padrão fornecidas para medir o desempenho.
As pontuações que o módulo retorna representam a alteração no desempenho de um modelo treinado depois da permutação. Os recursos importantes são geralmente mais sensíveis ao processo de colocar em ordem aleatória e, portanto, resultarão em maiores pontuações de importância.
Este artigo fornece uma boa visão geral da importância do recurso de permutação, sua base teórico e seus aplicativos no aprendizado de máquina: importância do recurso de permutação
Como usar a Importância do Recurso de Permuta
Para gerar um conjunto de pontuações de recursos, é necessário ter um modelo já treinado, bem como um conjunto de dados de teste.
Adicione o módulo Importância do Recurso de Permutação ao seu experimento. Esse módulo pode ser encontrado na categoria Seleção de Recurso.
Conecte um modelo treinado à entrada à esquerda. O modelo deve ser um modelo de regressão ou um modelo de classificação.
Na entrada direita, conecte um conjuntos de dados, preferencialmente um que seja diferente do conjuntos de dados usado para treinar o modelo. Esse conjuntos de dados é usado para pontuação com base no modelo treinado e para avaliar o modelo depois que os valores de recurso foram alterados.
Para Semente aleatória, digite um valor a ser usado como semente para randomização. Se você especificar 0 (o padrão), um número será gerado com base no relógio do sistema.
Um valor de semente é opcional, mas você deve fornecer um valor se quiser reprodutibilidade entre as executações do mesmo experimento.
Para Métrica para medir o desempenho, selecione uma única métrica a ser usada ao calcular a qualidade do modelo após a permutação.
Machine Learning Studio (clássico) dá suporte às seguintes métricas, dependendo se você está avaliando um modelo de classificação ou regressão:
Classificação
Precisão, precisão, recall, perda média de log
Regressão
Precisão, Recall, Erro Absoluto Média , Erro Quadrado Da Raiz Média, Erro Absoluto Relativo, Erro Quadrado Relativo, Coeficiente de Determinação
Para obter uma descrição mais detalhada dessas métricas de avaliação e como elas são calculadas, consulte Avaliar.
Execute o experimento.
O módulo saída de uma lista de colunas de recursos e as pontuações associadas a elas, classificadas na ordem das pontuações, em ordem decrescente.
Exemplos
Consulte estes experimentos de exemplo no Galeria de IA do Azure:
Importância do recurso de permutação: demonstra como usar este módulo para classificar variáveis de recurso de um conjuntos de dados em ordem de pontuações de importância de permutação.
Usando o módulo Importância do Recurso de Permutação: ilustra o uso deste módulo em um serviço Web.
Observações técnicas
Esta seção fornece detalhes de implementação, dicas e respostas para perguntas frequentes.
Como isso se compara a outros métodos de seleção de recursos?
A importância do recurso de permutação funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna por vez e avaliando o modelo.
As classificações fornecidas pela importância do recurso de permutação geralmente são diferentes das que você recebe da Seleção de Recursos Baseada em Filtro, que calcula as pontuações antes de um modelo ser criado.
Isso porque a importância do recurso de permutação não mede a associação entre um recurso e um valor de destino, mas captura a influência que cada recurso tem nas previsões do modelo.
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Modelo treinado | Interface ILearner | Um modelo de classificação ou regressão treinado |
Dados de teste | Tabela de Dados | O conjunto de dados de teste para classificar e avaliar um modelo depois da permutação de valores de recurso |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Padrão | Descrição |
---|---|---|---|---|---|
Propagação aleatória | Inteiro | >=0 | Obrigatório | 0 | Valor de propagação do gerador de número aleatório |
Métrica para medir o desempenho | EvaluationMetricType | selecionar na lista | Obrigatório | Classificação – Precisão | Selecione a métrica a ser usada ao avaliar a variabilidade do modelo após as permutações |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Importância do recurso | Tabela de Dados | Um conjunto de dados que contém os resultados de importância do recurso, com base na métrica selecionada |
Exceções
Exceção | Descrição |
---|---|
Erro 0062 | Ocorrerá uma exceção durante a tentativa de comparar dois modelos com tipos diferentes de aprendiz. |
Erro 0024 | Ocorrerá uma exceção se o conjunto de dados não contiver uma coluna de rótulo. |
Erro 0105 | Gerado quando um arquivo de definição de módulo define um tipo de parâmetro sem suporte |
Erro 0021 | Ocorrerá uma exceção se o número de linhas em alguns dos conjuntos de dados passados para o módulo for muito pequeno. |
Confira também
Seleção de recursos
Seleção de Recursos Baseada em Filtro
Análise de componente principal