Aplicar Filtro
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Aplica um filtro a colunas especificadas de um conjunto de dados
Categoria: Transformação de Dados / Filtro
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como utilizar o módulo 'Aplicar filtro' no Machine Learning Studio (clássico), para transformar uma coluna de valores aplicando um filtro previamente definido. Os filtros são utilizados no processamento de sinais digitais para reduzir o ruído ou realçar um padrão. Assim, os valores que transforma são sempre numéricos, e normalmente representam algum tipo de sinal áudio ou visual.
Dica
Está à procura de um tipo diferente de filtro? O Estúdio (clássico) fornece estes módulos para amostragem de dados, obtenção de um subconjunto de dados, remoção de maus valores ou criação de conjuntos de teste e treino: Dados divididos, dados em falta,partição e amostra, aplicar SQL transformação, valores de clip. Se precisar de filtrar dados à medida que os lê de uma fonte, consulte Os Dados de Importação. As opções dependem do tipo de origem.
Depois de determinar qual o tipo de filtro que é o melhor para a sua fonte de dados, especifique os parâmetros e use o Filtro de Aplicação para transformar o conjunto de dados. Como a conceção dos filtros é separada do processo de aplicação de um filtro, os filtros são reutilizáveis. Por exemplo, se trabalhar frequentemente com dados utilizados para a previsão, poderá conceber vários tipos de filtros médios móveis para treinar e comparar vários modelos. Também pode guardar o filtro para aplicar a outras experiências ou a diferentes conjuntos de dados.
Como configurar aplicar filtro
Adicione o módulo 'Aplicar filtro ' à sua experiência. Pode encontrar o módulo de filtro IIR na categoria De Transformação de Dados, na categoria Filtros .
À entrada da direita, ligue um conjunto de dados que contenha valores numéricos a uma entrada.
À entrada à esquerda, ligue um filtro existente. Pode reutilizar um filtro guardado ou pode configurar um filtro utilizando um dos seguintes módulos de filtro: Filtro de limiar, filtro médio móvel, filtro mediano, filtro IIR, filtro FIR, filtro definido pelo utilizador.
No painel de propriedades do Filtro De Aplicação, clique no seletor de colunas de lançamento e escolha as colunas às quais o filtro deve ser aplicado.
Executar a experiência, ou clique à direita Aplicar Filtro e clicar em Executar selecionado.
Resultados
A saída contém apenas os dados nas colunas selecionadas, transformadas aplicando a transformação matemática predefinida especificada.
Se pretender ver outras colunas no conjunto de dados, pode utilizar o módulo Add Columns para fundir os conjuntos de dados originais e filtrados.
Nota
Os valores na coluna original não foram eliminados ou substituídos, estando ainda disponíveis na experiência de referência. No entanto, a saída do filtro geralmente é mais útil para modelar.
Exemplos
Por exemplo, como os filtros são usados na aprendizagem automática, consulte a Galeria Azure AI:
- Filtros: Demonstra todos os tipos de filtro, utilizando um conjunto de dados de forma de onda projetado.
Notas técnicas
Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.
O módulo 'Filtro de Aplicação ' liga o tipo de filtro especificado às colunas selecionadas. Se precisar de aplicar diferentes tipos de filtros em diferentes colunas, deve utilizar Colunas Selecionadas no Conjunto de Dados para isolar as colunas e aplicar diferentes tipos de filtros em fluxos de trabalho separados. Para obter mais informações, consulte 'Selecionar Colunas' no Conjunto de Dados.
Os filtros não passam por colunas de dados que não são afetadas pelo filtro. Ou seja, a saída do Filtro Aplicado contém apenas os valores numéricos transformados. No entanto, pode utilizar o módulo Add Columns para unir valores transformados com o conjunto de dados de origem.
Períodos de filtragem
O período de filtração é determinado em parte pelo tipo de filtro, da seguinte forma:
Para uma resposta de impulso finita (FIR), uma média móvel simples e filtros médios triangulares em movimento, o período de filtro é finito.
Para uma resposta infinita por impulso (IIR), média de movimento exponencial e filtros médios em movimento cumulativo, o período de filtro é infinito.
Para os filtros limiar, o período de filtragem é sempre 1.
Para filtros medianos, independentemente do período de filtragem, as NaNs e os valores em falta no sinal de entrada não produzem novos NaNs na saída.
Valores em falta
Esta secção descreve o comportamento quando são encontrados valores em falta, por tipo de filtro. Em geral, quando um filtro encontra um NaN ou um valor em falta no conjunto de dados de entrada, o conjunto de dados de saída fica estragado com naNs para um número próximo de amostras, dependendo do período do filtro. Isto tem as seguintes consequências:
FIR, filtros médios em movimento simples ou triangulares têm um período finito. Como resultado, qualquer valor em falta será seguido por um número de NaNs iguais à ordem do filtro menos um.
IIR, a média de movimento exponencial ou os filtros médios em movimento cumulativo têm um período infinito. Como resultado, após o primeiro valor em falta ser encontrado, as NaNs continuarão a propagar-se indefinidamente.
Num filtro limiar, o período de um filtro limiar é 1. Como resultado, os valores em falta e as NaNs não se propagam.
Para filtros medianos, as NaNs e os valores em falta encontrados no conjunto de dados de entrada não produzem novos NaNs na saída, independentemente do período de filtragem.
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Filtro | Interface IFilter | Implementação do filtro |
Conjunto de dados | Tabela de Dados | Conjunto de dados de entrada |
Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.
Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.
Parâmetros do módulo
Nome | Intervalo | Tipo | Predefinição | Description |
---|---|---|---|---|
Conjunto de colunas | Qualquer | Seleção de Colunas | NumericAll | Selecione as colunas para filtrar |
Saída
Nome | Tipo | Description |
---|---|---|
Conjunto de dados de resultados | Tabela de Dados | Conjunto de dados de saída |