Selecionar colunas para transformação
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Cria uma transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados especificado
Categoria: transformação/manipulação de dados
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
este artigo descreve como usar o módulo selecionar colunas de transformação no Machine Learning Studio (clássico). A finalidade do módulo selecionar colunas de transformação é garantir que um conjunto de colunas consistente e previsível seja sempre usado em operações de aprendizado de máquina downstream.
Esse módulo é particularmente útil para tarefas como pontuação, que exigem colunas específicas. As alterações nas colunas disponíveis podem interromper o experimento ou alterar os resultados.
Use a transformação selecionar colunas para criar e salvar um conjunto de colunas. Em seguida, use o módulo Aplicar transformação para aplicar essas seleções a novos dados.
Como usar Selecionar colunas para transformação
Este cenário pressupõe que você pretende usar a seleção de recursos para gerar um conjunto dinâmico de colunas que serão usadas para treinar um modelo. Para garantir que as seleções de coluna sejam as mesmas para o processo de pontuação, use o módulo selecionar colunas de transformação para capturar as seleções de coluna e aplicá-las em outro lugar no experimento.
Adicione um conjunto de dados de entrada ao seu experimento no estúdio (clássico).
Adicione uma instância da Seleção de recursos baseada em filtro.
Conexão os módulos e configurar o módulo seleção de recursos para localizar automaticamente alguns dos melhores recursos no conjunto de dados de entrada.
Adicione uma instância do Modelo de treinamento e use a saída da Seleção de recursos baseada em filtro como a entrada para treinamento.
Importante
Como a importância do recurso é decidida com base nos valores na coluna, você não pode saber com antecedência quais colunas podem estar disponíveis para entrada para treinar o modelo.
Agora, anexe uma instância do módulo selecionar colunas de transformação .
Isso gera uma seleção de coluna como uma transformação que pode ser salva ou aplicada a outros conjuntos de os. Essa etapa garante que as colunas identificadas pela seleção de recursos sejam salvas para reutilização por outros módulos.
Adicionar o módulo Modelo de Pontuação.
Não conecte o conjunto de dados de entrada.
Em vez disso, adicione o módulo Aplicar transformação e conecte a saída do recurso transformação de seleção.
Importante
Não é possível esperar a aplicação da seleção de recursos baseada em filtro ao conjunto de texto de Pontuação e obter os mesmos resultados. Como a seleção de recursos se baseia em valores, ela pode escolher um conjunto diferente de colunas, o que causaria uma falha na operação de pontuação.
Execute o experimento.
Esse processo de salvar e aplicar uma seleção de coluna garante que o mesmo esquema de dados esteja disponível para treinamento e pontuação.
Exemplos
Para obter exemplos de como usar esse módulo, consulte a Galeria de ia do Azure:
Selecionar colunas de transformação: uma explicação completa que usa este módulo.
Filtrar recursos e removê-los das entradas de Pontuação: Salve este experimento em seu espaço de trabalho para ver como o módulo é usado em um fluxo experimental completo.
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Conjunto de linhas com colunas desejadas | Tabela de Dados | Conjunto de linhas que contém o conjunto desejado de colunas |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Transformação seleção de colunas | Interface ITransform | Transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados fornecido. |
Exceções
Exceção | Descrição |
---|---|
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia. |