Filter toepassen
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Een filter toepassen op opgegeven kolommen van een gegevensset
Categorie: Gegevenstransformatie/-filter
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Filter toepassen in Machine Learning Studio (klassiek) gebruikt om een kolom met waarden te transformeren door een eerder gedefinieerd filter toe te passen. Filters worden gebruikt in digitale signaalverwerking om ruis te verminderen of een patroon te markeren. De waarden die u transformeert, zijn dus altijd numeriek en vertegenwoordigen doorgaans een soort audio- of visueel signaal.
Tip
Zoekt u een ander type filter? Studio (klassiek) biedt deze modules voor het nemen van steekproeven van gegevens, het verkrijgen van een subset van gegevens, het verwijderen van slechte waarden of het maken van test- en trainingssets: Split Data, Clean Missing Data, Partition and Sample, Apply SQL Transformation, Clip Values. Zie Gegevens importeren als u gegevens wilt filteren terwijl u deze uit een bron leest. De opties zijn afhankelijk van het brontype.
Nadat u hebt bepaald welk type filter het beste is voor uw gegevensbron, geeft u de parameters op en gebruikt u Filter toepassen om de gegevensset te transformeren. Omdat het ontwerp van filters gescheiden is van het proces van het toepassen van een filter, kunnen filters opnieuw worden gebruikt. Als u bijvoorbeeld vaak werkt met gegevens die worden gebruikt voor prognoses, kunt u verschillende typen filters voor bewegend gemiddelde ontwerpen om meerdere modellen te trainen en te vergelijken. U kunt het filter ook opslaan om toe te passen op andere experimenten of op verschillende gegevenssets.
Filter toepassen configureren
Voeg de module Filter toepassen toe aan uw experiment. U vindt de IIR-filtermodule onder Gegevenstransformatie in de categorie Filters.
Verbind met de rechterinvoer een gegevensset die numerieke waarden bevat met één invoer.
Verbind een bestaand filter met de linkerinvoer. U kunt een opgeslagen filter opnieuw gebruiken of u kunt een filter configureren met behulp van een van de volgende filtermodules : Drempelfilter , Gemiddeld filter verplaatsen, Mediaanfilter, IIR-filter, FIR-filter, door de gebruiker gedefinieerd filter.
Klik in het deelvenster Eigenschappen van Filter toepassen op Kolomselectie starten en kies de kolommen waarop het filter moet worden toegepast.
Voer het experiment uit of klik met de rechtermuisknop op Filter toepassen en klik op Uitvoeren geselecteerd.
Resultaten
De uitvoer bevat alleen de gegevens in de geselecteerde kolommen, getransformeerd door de opgegeven vooraf gedefinieerde wiskundige transformatie toe te passen.
Als u andere kolommen in de gegevensset wilt zien, kunt u de module Kolommen toevoegen gebruiken om de oorspronkelijke en gefilterde gegevenssets samen te voegen.
Notitie
De waarden in de oorspronkelijke kolom zijn niet verwijderd of overschreven en zijn nog steeds beschikbaar in het experiment ter referentie. De uitvoer van het filter is doorgaans echter nuttiger voor modellering.
Voorbeelden
Voor voorbeelden van hoe filters worden gebruikt in machine learning, zie de Azure AI Gallery:
- Filters: demonstreert alle filtertypen met behulp van een ontworpen Waveform-gegevensset.
Technische opmerkingen
Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.
De module Filter toepassen verbindt het opgegeven type filter met de geselecteerde kolommen. Als u verschillende typen filters op verschillende kolommen wilt toepassen, moet u Kolommen in gegevensset selecteren gebruiken om de kolommen te isoleren en verschillende filtertypen toe te passen in afzonderlijke werkstromen. Zie Select Columns in Dataset (Kolommen in gegevensset selecteren) voor meer informatie.
De filters geven geen gegevenskolommen door die niet worden beïnvloed door het filter. Dat wil zeggen dat de uitvoer van Filter toepassen alleen de getransformeerde numerieke waarden bevat. U kunt echter de module Kolommen toevoegen gebruiken om getransformeerde waarden samen te voegen met de bron-gegevensset.
Filterperioden
De filterperiode wordt deels bepaald door het filtertype, als volgt:
Voor eindige reactie op het responsvermogen (FIR), eenvoudige bewegende gemiddelden en triangular moving average filters is de filterperiode eindig.
Voor oneindig reactievermogen (IIR), exponentieel bewegend gemiddelde en cumulatieve filters voor het bewegende gemiddelde, is de filterperiode oneindig.
Voor drempelfilters is de filterperiode altijd 1.
Voor mediaanfilters produceren NaN's en ontbrekende waarden in het invoersignaal geen nieuwe NaN's in de uitvoer, ongeacht de filterperiode.
Ontbrekende waarden
In deze sectie wordt het gedrag beschreven wanneer ontbrekende waarden worden aangetroffen, per filtertype. Wanneer een filter een NaN of een ontbrekende waarde in de invoerset aangetroffen, wordt de uitvoerset over het algemeen voor een aantal voorbeelden nan,afhankelijk van de filterperiode. Dit heeft de volgende gevolgen:
FIR, eenvoudig bewegend gemiddelde of triangular moving average-filters hebben een eindige periode. Als gevolg hiervan wordt elke ontbrekende waarde gevolgd door een aantal NaN's dat gelijk is aan de filtervolgorde min één.
IIR, exponentieel bewegend gemiddelde of cumulatieve filters voor het bewegende gemiddelde hebben een oneindige periode. Als gevolg hiervan worden NaN's na het aangetroffen van de eerste ontbrekende waarde voor onbepaalde tijd doorgegeven.
In een drempelfilter is de periode van een drempelfilter 1. Als gevolg hiervan worden ontbrekende waarden en NaN's niet doorgegeven.
Voor mediaanfilters produceren NaN's en ontbrekende waarden die zijn aangetroffen in de invoerset geen nieuwe NaN's in de uitvoer, ongeacht de filterperiode.
Verwachte invoer
Naam | Type | Description |
---|---|---|
Filter | Interface IFilter | Implementatie van filters |
Gegevensset | Gegevenstabel | Invoerset |
Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).
Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.
Moduleparameters
Name | Bereik | Type | Standaard | Beschrijving |
---|---|---|---|---|
Kolomset | Alle | ColumnSelection | NumericAll | De kolommen selecteren die moeten worden gefilterd |
Uitvoer
Naam | Type | Description |
---|---|---|
Gegevensset met resultaten | Gegevenstabel | Uitvoerset |