Komponenta podpůrných vektorových počítačů se dvěma třídami
Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.
Tato komponenta slouží k vytvoření modelu založeného na algoritmu podpůrných vektorů.
Metody učení s podporou podpůrných vektorů (SVM) jsou dobře prozkoumávanou třídou metod učení pod dohledem. Tato konkrétní implementace je vhodná pro predikci dvou možných výsledků na základě souvislých nebo kategorických proměnných.
Po definování parametrů modelu vytrénujte model pomocí trénovacích komponent a zadejte označenou datovou sadu , která obsahuje sloupec popisku nebo výsledku.
Informace o podpůrných vektorech
Podpůrné vektory jsou mezi nejstaršími algoritmy strojového učení a modely SVM se používají v mnoha aplikacích, od načítání informací až po klasifikaci textu a obrázků. SVM je možné použít pro úlohy klasifikace i regrese.
Tento model SVM je model učení pod dohledem, který vyžaduje označená data. V procesu trénování algoritmus analyzuje vstupní data a rozpozná vzory v multidimenzionálním prostoru funkcí, kterému se říká hyperplane. Všechny vstupní příklady jsou reprezentovány jako body v tomto prostoru a mapují se na výstupní kategorie takovým způsobem, že kategorie jsou rozděleny co nejširším a co nejjasnější mezerou.
Pro predikci algoritmus SVM přiřadí nové příklady do jedné kategorie nebo druhé a mapuje je do stejného prostoru.
Způsob konfigurace
Pro tento typ modelu se doporučuje před použitím klasifikátoru normalizovat datovou sadu.
Přidejte do kanálu komponentu Podpůrný vektorový stroj se dvěma třídami.
Určete, jak chcete model trénovat, nastavením možnosti Vytvořit režim trenéra.
Jeden parametr: Pokud víte, jak chcete model nakonfigurovat, můžete jako argumenty zadat konkrétní sadu hodnot.
Rozsah parametrů: Pokud si nejste jistí nejlepšími parametry, můžete optimální parametry najít pomocí komponenty Tune Model Hyperparameters . Zadáte určitý rozsah hodnot a trenér iteruje více kombinací nastavení, aby určil kombinaci hodnot, které vedou k dosažení nejlepšího výsledku.
Do pole Počet iterací zadejte číslo, které označuje počet iterací použitých při sestavování modelu.
Tento parametr lze použít k řízení kompromisu mezi rychlostí trénování a přesností.
Pro lambda zadejte hodnotu, která se má použít jako váha pro regularizaci L1.
Tento regulární koeficient lze použít k ladění modelu. Větší hodnoty postihují složitější modely.
Pokud chcete normalizovat funkce před trénováním, vyberte možnost Normalizovat funkce.
Pokud použijete normalizaci, před trénováním se datové body zacentrují na střední a škálují se tak, aby měly jednu jednotku směrodatné odchylky.
Vyberte možnost Project to the unit sphere, to normalizační koeficienty.
Promítání hodnot do prostoru jednotek znamená, že před trénováním se datové body zacentrují na 0 a škálují se tak, aby měly jednu jednotku směrodatné odchylky.
V počátečním počtu náhodných čísel zadejte celočíselnou hodnotu, kterou chcete použít jako počáteční hodnotu, pokud chcete zajistit reprodukovatelnost mezi běhy. V opačném případě se jako počáteční hodnota použije systémová hodnota hodin, což může vést k mírně odlišným výsledkům napříč běhy.
Připojte datovou sadu s popiskem a vytrénujte model:
Pokud nastavíte režim Vytvořit trenéra na Jeden parametr, připojte označenou datovou sadu a komponentu Train Model .
Pokud nastavíte režim Vytvořit trenéra na rozsah parametrů, připojte označenou datovou sadu a vytrénujte model pomocí hyperparametrů ladění modelu.
Poznámka:
Pokud do trénování modelu předáte rozsah parametrů, použije pouze výchozí hodnotu v seznamu parametrů.
Pokud předáte jednu sadu hodnot parametrů komponentě Tune Model Hyperparameters , pokud očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro žáka.
Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se v rámci úklidu zadaná jedna hodnota, i když se v rozsahu hodnot změní jiné parametry.
Odešlete kanál.
Výsledky
Po dokončení trénování:
Pokud chcete uložit snímek natrénovaného modelu, vyberte kartu Výstupy v pravém panelu komponenty Trénování modelu . Výběrem ikony Zaregistrovat datovou sadu uložte model jako opakovaně použitelnou komponentu.
Pokud chcete použít model pro bodování, přidejte do kanálu komponentu Určení skóre modelu .
Další kroky
Podívejte se na sadu komponent dostupných pro Azure Machine Learning.