Importância da funcionalidade de permutação
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Calcula a permutação característica pontuações de variações de características dado um modelo treinado e um conjunto de dados de teste
Categoria: Módulos de Seleção de Recursos
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como usar o módulo De Importância de Recurso de Permutação no Machine Learning Studio (clássico), para calcular um conjunto de pontuações de importância de recurso para o seu conjunto de dados. Utiliza estas pontuações para o ajudar a determinar as melhores funcionalidades para utilizar num modelo.
Neste módulo, os valores de características são baralhados aleatoriamente, uma coluna de cada vez, e o desempenho do modelo é medido antes e depois. Pode escolher uma das métricas padrão fornecidas para medir o desempenho.
As pontuações que o módulo devolve representam a alteração no desempenho de um modelo treinado, após permutação. Características importantes são geralmente mais sensíveis ao processo de baralhar, e assim resultar em pontuações de maior importância.
Este artigo fornece uma boa visão geral da importância da permutação, a sua base teórica e as suas aplicações na aprendizagem automática: A permutação tem importância
Como usar a importância da característica de permutação
Para gerar um conjunto de pontuações de funcionalidades requer que tenha um modelo já treinado, bem como um conjunto de dados de teste.
Adicione o módulo de Importância de Recurso de Permutação à sua experiência. Pode encontrar este módulo na categoria 'Seleção de Recursos '.
Ligação um modelo treinado para a entrada esquerda. O modelo deve ser um modelo de regressão ou modelo de classificação.
Na entrada direita, ligue um conjunto de dados, de preferência diferente do conjunto de dados utilizado para a formação do modelo. Este conjunto de dados é utilizado para pontuar com base no modelo treinado e para avaliar o modelo após a alteração dos valores da funcionalidade.
Para sementes aleatórias, escreva um valor a utilizar como semente para aleatoriedade. Se especificar 0 (o padrão), um número é gerado com base no relógio do sistema.
Um valor de sementes é opcional, mas você deve fornecer um valor se você quiser reprodutibilidade através de execuções da mesma experiência.
Para medir o desempenho, selecione uma única métrica para utilizar ao calcular a qualidade do modelo após a permutação.
Machine Learning Studio (clássico) suporta as seguintes métricas, dependendo se está a avaliar um modelo de classificação ou regressão:
Classificação
Precisão, Precisão, Recordação, Perda média de registo
Regressão
Precisão, Recordação, Erro Absoluto Médio, Erro Quadrado Médio Raiz, Erro Absoluto Relativo, Erro A quadrado relativo, Coeficiente de Determinação
Para uma descrição mais detalhada destas métricas de avaliação e como são calculadas, consulte Avaliar.
Execute a experimentação.
O módulo produz uma lista de colunas de funcionalidades e as pontuações associadas a elas, classificadas por ordem das pontuações, descendo.
Exemplos
Veja estas experiências de amostra na Galeria Azure AI:
Importância da característica de permutação: Demonstra como usar este módulo para classificar variáveis de um conjunto de dados por ordem de pontuações de importância de permutação.
Utilizando o módulo De Importância da Característica Permutação: Ilustra a utilização deste módulo num serviço web.
Notas técnicas
Esta secção fornece detalhes de implementação, dicas e respostas a perguntas frequentes.
Como é que isto se compara a outros métodos de seleção de recursos?
A permutação de recursos funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna de cada vez e, em seguida, avaliando o modelo.
Os rankings fornecidos pela importância da funcionalidade de permutação são muitas vezes diferentes dos que obtém da Seleção de Recursos Baseados em Filtros, que calcula as pontuações antes de um modelo ser criado.
Isto porque a permutação tem importância não mede a associação entre um recurso e um valor-alvo, mas em vez disso capta a influência que cada recurso tem nas previsões do modelo.
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Modelo treinado | Interface ILearner | Um modelo de classificação ou regressão treinado |
Dados de teste | Tabela de Dados | Conjunto de dados de teste para pontuação e avaliação de um modelo após permutação dos valores de recurso |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Predefinição | Description |
---|---|---|---|---|---|
Sementes aleatórias | Número inteiro | >=0 | Necessário | 0 | Valor aleatório das sementes do gerador de números |
Métrica para medir o desempenho | Tipo De Avaliação | selecionar a partir da lista | Necessário | Classificação - Precisão | Selecione a métrica a utilizar ao avaliar a variabilidade do modelo após permutações |
Saídas
Nome | Tipo | Description |
---|---|---|
Importância do recurso | Tabela de Dados | Um conjunto de dados que contém os resultados de importância da funcionalidade, com base na métrica selecionada |
Exceções
Exceção | Description |
---|---|
Erro 0062 | A exceção ocorre quando se tenta comparar dois modelos com diferentes tipos de aprendizes. |
Erro 0024 | A exceção ocorre se o conjunto de dados não contiver uma coluna de etiqueta. |
Erro 0105 | Lançado quando um ficheiro de definição de módulo define um tipo de parâmetro não suportado |
Erro 0021 | A exceção ocorre se o número de linhas em alguns dos conjuntos de dados passados para o módulo for demasiado pequeno. |
Ver também
Seleção de Recursos
Seleção de funcionalidades baseadas em filtro
Análise principal de componentes