Důležitost funkce permutací
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Vypočítá skóre funkce permutace skóre funkcí s ohledem na trained model a testovací datovou sadu.
Kategorie: moduly výběru funkcí
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak použít modul důležitost funkcí permutace v aplikaci Machine Learning Studio (classic) k výpočtu sady výsledků důležitosti funkcí pro datovou sadu. Tato skóre vám pomůžou určit nejlepší funkce pro použití v modelu.
V tomto modulu jsou hodnoty funkcí náhodně přemístěné, jeden sloupec v čase a výkon modelu se měří před a po. Můžete zvolit jednu ze standardních metrik, které jsou k dispozici pro měření výkonu.
Skóre, které modul vrací, představuje změnu výkonu pro vyškolený model po permutaci. Důležité funkce jsou obvykle citlivější na proces náhodného zpracování a výsledkem bude vyšší důležitost.
Tento článek poskytuje dobrý obecný přehled důležitosti funkcí permutace, teoreticky a jeho aplikací ve strojovém učení: Permutace – důležitost funkcí
Použití funkce permutace důležitost
Aby bylo možné vygenerovat sadu výsledků funkcí, je nutné mít již vyškolený model i testovací datovou sadu.
Přidejte modul důležitosti funkce permutace do experimentu. Tento modul můžete najít v kategorii výběru funkcí .
pro levý vstup Připojení školený model. Model musí být regresní model nebo model klasifikace.
Ve správném vstupu připojte datovou sadu, nejlépe tu, která se liší od datové sady použité pro školení modelu. Tato datová sada se používá pro hodnocení založené na škole modelu a pro vyhodnocení modelu po změně hodnot funkcí.
V případě náhodného osazenízadejte hodnotu, která se má použít jako počáteční hodnota pro náhodnost. Pokud zadáte 0 (výchozí), vygeneruje se číslo na základě systémových hodin.
Hodnota počáteční hodnoty je volitelná, ale měli byste zadat hodnotu, pokud chcete mít reprodukovatelnost v průběhu stejného experimentu.
Pro metriku pro měření výkonuvyberte jednu metriku, která se použije při výpočtu kvality modelu po permutaci.
Machine Learning Studio (classic) podporuje následující metriky v závislosti na tom, jestli vyhodnocujete model klasifikace nebo regrese:
Classification
Přesnost, přesnost, odvolání, průměrná ztráta protokolu
Regrese
Přesnost, odvolání, Přibližná absolutní chyba, hlavní střední hodnota chyby, relativní absolutní chyba, relativní navýšení chyby, koeficient stanovitelnosti
Podrobnější popis těchto metrik vyhodnocení a jejich výpočtu naleznete v tématu Evaluate.
Spusťte experiment.
Modul vytvoří výstup seznamu sloupců funkcí a skóre, která jsou k nim přidružená, seřazené podle skóre, sestupné.
Příklady
Podívejte se na tyto ukázkové experimenty v Azure AI Gallery:
Permutace – funkce důležitost: ukazuje, jak tento modul použít k seřazení proměnných funkcí v datové sadě v pořadí podle skóre hodnoty permutace.
Použití modulu důležitost funkcí permutace: demonstruje použití tohoto modulu ve webové službě.
Technické poznámky
V této části najdete podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.
Jak to dělá porovnání s jinými metodami výběru funkcí?
Funkce permutace: význam funguje náhodným změnou hodnot každého sloupce funkce, jednoho sloupce v čase a následným vyhodnocením modelu.
Klasifikace funkce permutace je často odlišná od těch, které dostanete z výběru funkce založeného na filtru, který počítá skóre před vytvořením modelu.
Důvodem je to, že důležitost funkcí permutace neměří přidružení mezi funkcí a cílovou hodnotou, ale místo toho zachycuje, jak velká mají jednotlivé funkce v předpovědi z modelu.
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Školený model | Rozhraní ILearner | Vyškolený model klasifikace nebo regrese |
Testovací data | Tabulka dat | Testovací sada pro bodování a vyhodnocení modelu po permutaci hodnot funkcí |
Parametry modulu
Název | Typ | Rozsah | Volitelné | Výchozí | Description |
---|---|---|---|---|---|
Náhodné osazení | Integer | >= 0 | Vyžadováno | 0 | Počáteční hodnota generátoru náhodných čísel |
Metrika pro měření výkonu | EvaluationMetricType | vybrat ze seznamu | Vyžadováno | Přesnost klasifikace | Vyberte metriku, která se má použít při vyhodnocení proměnlivosti modelu po permutacích. |
Výstupy
Název | Typ | Description |
---|---|---|
Důležitost funkce | Tabulka dat | Datová sada obsahující výsledky důležité funkce na základě vybrané metriky |
Výjimky
Výjimka | Description |
---|---|
Chyba 0062 | Při pokusu o porovnání dvou modelů s různými typy informací dojde k výjimce. |
Chyba 0024 | K výjimce dojde, pokud datová sada neobsahuje sloupec popisku. |
Chyba 0105 | Vyvoláno, když definiční soubor modulu definuje typ parametru nepodporovaný. |
Chyba 0021 | K výjimce dojde v případě, že počet řádků v některých datových sadách předaných do modulu je příliš malý. |
Viz také
Výběr funkcí
Výběr funkcí na základě filtrů
Analýza hlavní komponenty