Använd filter
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Tillämpar ett filter på angivna kolumner i en datauppsättning
Kategori: Datatransformering/filter
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Modulöversikt
Den här artikeln beskriver hur du använder modulen Tillämpa filter i Machine Learning Studio (klassisk) för att transformera en kolumn med värden genom att använda ett tidigare definierat filter. Filter används vid digital signalbearbetning för att minska bruset eller markera ett mönster. Därför är de värden som du transformerar alltid numeriska och representerar vanligtvis någon typ av ljud- eller visuell signal.
Tips
Letar du efter en annan typ av filter? Studio (klassisk) tillhandahåller dessa moduler för samplingsdata, hämtar en delmängd data, tar bort dåliga värden eller skapar test- och träningsuppsättningar: Dela upp data, Rensa data som saknas, Partition och Exempel, Tillämpa SQL-transformering, Clip Values. Om du behöver filtrera data när du läser dem från en källa kan du läsa Importera data. Alternativen beror på källtypen.
När du har avgöra vilken typ av filter som passar bäst för din datakälla anger du parametrarna och använder Tillämpa filter för att transformera datauppsättningen. Eftersom filterdesignen är separat från processen för att tillämpa ett filter kan filter återanvändas. Om du till exempel ofta arbetar med data som används för prognostiserade data kan du utforma flera typer av glidande genomsnittsfilter för att träna och jämföra flera modeller. Du kan också spara filtret för att tillämpa på andra experiment eller på olika datauppsättningar.
Så här konfigurerar du Tillämpa filter
Lägg till modulen Tillämpa filter i experimentet. Du hittar IIR-filtermodulen under Datatransformering i kategorin Filter.
Till höger indata ansluter du en datauppsättning som innehåller numeriska värden till en indata.
Anslut ett befintligt filter till vänster indata. Du kan använda ett sparat filter igen eller konfigurera ett filter med någon av följande filtermoduler: Tröskelvärdesfilter, Glidande medelvärdesfilter, Medianfilter, IIR-filter, FIR-filter, Användardefinierat filter.
I fönstret Egenskaper i Tillämpa filter klickar du på Starta kolumnväljaren och väljer de kolumner som filtret ska tillämpas på.
Kör experimentet eller högerklicka på Använd filter och klicka på Kör valt.
Resultat
Utdata innehåller endast data i de valda kolumnerna, transformerade genom att tillämpa den angivna fördefinierade matematiska transformeringen.
Om du vill se andra kolumner i datauppsättningen kan du använda modulen Lägg till kolumner för att sammanfoga de ursprungliga och filtrerade datauppsättningarna.
Anteckning
Värdena i den ursprungliga kolumnen har inte tagits bort eller skrivits över och är fortfarande tillgängliga i experimentet som referens. Utdata från filtret är dock vanligtvis mer användbara för modellering.
Exempel
Exempel på hur filter används i maskininlärning finns i Azure AI Gallery:
- Filter: Visar alla filtertyper med hjälp av en utformad vågformsdatamängd.
Teknisk information
Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.
Modulen Tillämpa filter binder den angivna typen av filter till de valda kolumnerna. Om du behöver använda olika typer av filter för olika kolumner bör du använda Välj kolumner i datauppsättning för att isolera kolumnerna och tillämpa olika filtertyper i separata arbetsflöden. Mer information finns i Välj kolumner i datauppsättning.
Filtren passerar inte genom datakolumner som inte påverkas av filtret. Det innebär att utdata från Tillämpa filter endast innehåller de transformerade numeriska värdena. Du kan dock använda modulen Lägg till kolumner för att koppla transformerade värden till källdatauppsättningen.
Filtrera perioder
Filterperioden bestäms delvis av filtertypen enligt följande:
Filterperioden är begränsad för FIR (finite styrd respons), enkelt glidande medelvärde och triangular glidande medelvärdesfilter.
För IIR (Infinite Infinite Response), exponentiellt glidande medelvärde och kumulativt glidande medelvärdesfilter är filterperioden oändlig.
För tröskelvärdesfilter är filterperioden alltid 1.
För medianfilter skapar inte NaN-värden och saknade värden i indatasignalen nya NaN i utdata, oavsett filterperiod.
Saknade värden
I det här avsnittet beskrivs beteendet när saknade värden påträffas, efter filtertyp. När ett filter i allmänhet stöter på ett NaN eller ett värde som saknas i indatauppsättningen blir utdatauppsättningen försedd med NaN för några nästa antal exempel, beroende på filterperioden. Detta får följande konsekvenser:
FILTER för FIR, enkelt glidande medelvärde eller triangular glidande medelvärde har en begränsad period. Därför följs alla saknade värden av ett antal NaN som är lika med filterordningen minus ett.
Filtren IIR, exponentiellt glidande medelvärde eller kumulativt glidande medelvärde har en oändlig period. När det första saknade värdet har påträffats fortsätter därför NaN att spridas på obestämd tid.
I ett tröskelvärdesfilter är perioden för ett tröskelvärdesfilter 1. Det innebär att saknade värden och NaN inte sprids.
För medianfilter NaN och saknade värden som påträffas i indatauppsättningen producerar inte nya NaN i utdata, oavsett filterperiod.
Förväntade indata
Namn | Typ | Description |
---|---|---|
Filtrera | IFilter-gränssnitt | Filterimplementering |
Datamängd | Datatabell | Indatauppsättning |
En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.
En lista över API-undantag finns i Machine Learning REST API felkoder.
Modulparametrar
Name | Intervall | Typ | Standardvärde | Description |
---|---|---|---|---|
Kolumnuppsättning | Valfri | ColumnSelection | NumericAll | Välj de kolumner som ska filtreras |
Utdata
Namn | Typ | Description |
---|---|---|
Resultatdatauppsättning | Datatabell | Utdatauppsättning |