Selecionar colunas para transformação
Este artigo descreve como usar o componente Selecionar Colunas para Transformação no Azure Machine Learning Designer. A finalidade do componente Selecionar Colunas para Transformação é garantir que um conjunto de colunas consistente e previsível seja usado em operações de aprendizado de máquina downstream.
Esse componente é útil para tarefas como pontuação, que exigem colunas específicas. As alterações nas colunas disponíveis podem interromper o pipeline ou alterar os resultados.
Use Selecionar colunas para transformação para criar e salvar um conjunto de colunas. Em seguida, use o componente Aplicar Transformação para aplicar essas seleções a novos dados.
Como usar Selecionar colunas para transformação
Esse cenário pressupõe que você deseja usar a seleção de recursos para gerar um conjunto dinâmico de colunas que serão usadas para treinar um modelo. Para garantir que as seleções de coluna sejam as mesmas para o processo de pontuação, use o componente Selecionar Colunas para Transformação para capturar as seleções de coluna e aplicá-las em outro lugar no pipeline.
Adicione um conjunto de dados de entrada ao seu pipeline no designer.
Adicione uma instância da Seleção de recursos baseada em filtro.
Conecte os componentes e configure o componente de seleção de recursos para localizar automaticamente uma série de melhores recursos no conjunto de dados de entrada.
Adicione uma instância do Modelo de treinamento e use a saída da Seleção de recursos baseada em filtro como a entrada para treinamento.
Importante
Como a importância do recurso é baseada nos valores na coluna, você não pode saber com antecedência quais colunas podem estar disponíveis para entrada para treinar o modelo.
Anexe uma instância do componente Selecionar Colunas para Transformação.
Esta etapa gera uma seleção de coluna como uma transformação que pode ser salva ou aplicada a outros conjuntos de os. Essa etapa garante que as colunas identificadas na seleção de recursos sejam salvas para que outros componentes reutilizem.
Adicionar o componente Pontuação de Modelo.
Não conecte o conjunto de dados de entrada. Em vez disso, adicione o componente Aplicar Transformação e conecte a saída do recurso transformação de seleção.
A estrutura do pipeline deve ser semelhante à seguinte:
Importante
Você não pode esperar a aplicação da Seleção de recursos baseada em filtro ao conjunto de texto de Pontuação e obter os mesmos resultados. Como a seleção de recursos se baseia em valores, ela pode escolher um conjunto diferente de colunas, o que causaria uma falha na operação de pontuação.
Envie o pipeline.
Esse processo de salvar e aplicar uma seleção de coluna garante que o mesmo esquema de dados esteja disponível para treinamento e pontuação.
Próximas etapas
Confira o conjunto de componentes disponíveis no Azure Machine Learning.