Datatransformering – filter
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Den här artikeln beskriver hur du kan använda filtermodulerna i Machine Learning Studio (klassisk) för att transformera digitala data. Modulerna i den här gruppen med verktyg för Machine Learning Studio (klassisk) baseras på filter som har utvecklats för digital signalbehandlingsteknik.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler finns i Azure Machine Learning designer.
Filter tillämpas vanligtvis på data i databearbetningssteget eller förbearbetningssteget. Filter förbättrar tydligheten i den signal som används för maskininlärning. Du kan till exempel använda filtermodulerna i Machine Learning Studio (klassisk) för dessa bearbetningsuppgifter:
- Rensa vågformer som används för taligenkänning.
- Identifiera trender eller ta bort säsongseffekter i störande försäljning eller ekonomiska data.
- Analysera mönster eller artefakter i telemetrisignaler.
Dessa moduler ger enkel konfiguration av filter genom att använda väl underbyggda algoritmer för att matematiskt transformera vågformsdata. Du kan också skapa ett anpassat filter om du redan har fastställt rätt koefficienter för dina data.
Relaterade uppgifter
Om du behöver utföra uppgifter som att exkluderas data från en datauppsättning rad för rad, ta bort saknade värden eller minska storleken på en datauppsättning använder du dessa moduler i stället:
- Rensa saknade data: Ta bort saknade värden eller ersätt saknade värden med platshållare.
- Partition och exempel: Dela upp eller filtrera datauppsättningen med hjälp av villkor, till exempel ett datumintervall, ett visst värde eller reguljära uttryck.
- Clip-värden: Ange ett värdeintervall och behåll endast värdena inom det intervallet.
Filter i digital signalbearbetning
Precis som du kan koppla ett filter till en kamera för att kompensera för belysning eller för att skapa specialeffekter kan du använda ett filter för de data som du använder för maskininlärning. Filter kan förbättra tydligheten i en signal, fånga intressanta egenskaper eller minska brus.
Det idealiska filtret skulle eliminera allt brus och ha en enhetlig känslighet för önskad signal. Men att utforma även ett ganska bra filter kan ta många iterationer eller kombinationer av tekniker. Om du lyckas utforma ett effektivt filter bör du överväga att spara filtret så att du kan återanvända det när du transformerar nya data.
I allmänhet baseras filtreringen på principerna för vågformsanalys. När du utformar ett filter letar du efter sätt att undertrycka eller förstärka delar av signalen, exponera underliggande trender, minska brus och interferens eller identifiera datavärden som annars kanske inte uppfattas.
Olika tekniker används för att dela upp enskilda trender eller vågformskomponenter som skapar faktiska datavärden. Serien med värden kan analyseras med hjälp av trigonometriska funktioner för att identifiera och isolera enskilda vågformer. (Detta gäller oavsett om det är en ekonometrisk serie eller sammansatta frekvenser av ljudsignaler.) Filter kan sedan tillämpas på dessa vågformer för att eliminera brus, förstärka vissa vågor eller ta bort riktade komponenter.
När filtrering tillämpas på en brusserie för att isolera olika komponenter kan du ange vilka frekvenser som ska tas bort eller förstärkas genom att ange frekvensintervallet som ska användas med.
Digitala filter i Machine Learning Studio (klassisk)
Följande typer av filter stöds i Machine Learning Studio (klassisk):
- Filter baserade på vågforms nedbrytning. Exempel är finita impulser (FIR) och IIR-filter (Infinite Impulse Response). Dessa filter fungerar genom att ta bort specifika komponenter från en övergripande serie. Du kan sedan visa och undersöka den förenklade vågformen.
- Filter baserat på glidande medelvärden eller medianvärden. Dessa filter jämnar ut variationerna i en dataserie genom genomsnitt över tidsperioder. Fönstren kan vara fasta eller glidande och kan ha olika former. Till exempel toppar ett triangulärt fönster vid den aktuella datapunkten (viktar det aktuella värdet starkare) och avtar före och efter datapunkten (vikter före och efter värden som är mindre starka).
- Användardefinierade eller anpassade filter. Om du redan känner till de transformeringar som ska tillämpas på en dataserie kan du skapa ett användardefinierat filter. Du anger de numeriska koefficienterna som används för att transformera dataserien. Ett anpassat filter kan emulera ett FIR- eller IIR-filter. Men med ett anpassat filter har du mer kontroll över de värden som ska tillämpas vid varje punkt i serien.
Filterterminologi
Följande lista innehåller enkla definitioner av termer som används i parametrarna och egenskaperna för filter:
- Passband: Frekvensintervallet som kan passera genom ett filter utan att dämpas eller försvagas.
- Stoppband: Ett intervall med frekvenser mellan angivna gränser genom vilka signaler inte skickas. Du definierar stoppbandet genom att ange avskurna frekvenser.
- Högt pass: Låt endast höga frekvenser gå igenom.
- Lågt pass: Acceptera endast frekvenser under ett angivet gränsvärde.
- Hörn: Definierar gränsen mellan stoppband- och passbandfrekvenserna. Vanligtvis har du möjlighet att bestämma om hörnet ska ingå i eller exkluderas från bandet. Ett filter i första ordningen orsakar gradvis dämpning tills hörnfrekvensen. Därefter orsakar filtret exponentiell dämpning. Filter med högre ordning (till exempel Butterworth- och Chebyshev-filter) har brantare lutningar efter hörnfrekvensen. Filter med högre ordning dämpar värdena i stoppbandet mycket snabbare och fullständigt.
- Bandstop-filter (kallas även för ett filter för att avvisa band eller ett hackfilter ): Har bara ett stoppband. Du definierar stoppbandet genom att ange två frekvenser: den höga brytfrekvensen och den låga brytfrekvensen. Ett bandpassfilter har vanligtvis två stoppband: ett på vardera sidan av önskad komponent.
- Krusning: En liten, oönskad variant som förekommer regelbundet. I Machine Learning kan du ange hur mycket krusning som ska tolereras som en del av parametrarna i IIR-filterdesignen.
Tips
Behöver du mer information? Om du är nybörjare på digital signalbearbetning kan du läsa En introduktion till digital signalbearbetning. Webbplatsen innehåller definitioner och användbara visuella hjälpmedel som förklarar grundläggande terminologi och begrepp.
Lista över moduler
Följande moduler ingår i kategorin Datatransformering – filter :
- Använd filter: Använder ett filter för angivna kolumner i en datauppsättning.
- FIR-filter: Skapar ett FIR-filter för signalbearbetning.
- IIR-filter: Skapar ett IIR-filter för signalbearbetning.
- Medianfilter: Skapar ett medianfilter som används för att jämna ut data för trendanalys.
- Glidande medelvärdesfilter: Skapar ett glidande medelvärdesfilter som jämnar ut data för trendanalys.
- Tröskelfilter: Skapar ett tröskelvärdesfilter som begränsar värden.
- Användardefinierat filter: Skapar ett anpassat FIR- eller IIR-filter.