Dela via


Komponent för tvåklasssstödvektordatorer

I den här artikeln beskrivs en komponent i Azure Machine Learning-designern.

Använd den här komponenten för att skapa en modell som baseras på algoritmen för stödvektordatorn.

Stödvektormaskiner (SVM) är en väl undersökt klass med övervakade inlärningsmetoder. Den här implementeringen lämpar sig för förutsägelse av två möjliga resultat, baserat på antingen kontinuerliga eller kategoriska variabler.

När du har definierat modellparametrarna tränar du modellen med hjälp av träningskomponenterna och tillhandahåller en taggad datauppsättning som innehåller en etikett eller resultatkolumn.

Om stödvektordatorer

Stödvektormaskiner är bland de tidigaste maskininlärningsalgoritmerna, och SVM-modeller har använts i många program, från informationshämtning till text- och bildklassificering. SVM:er kan användas för både klassificerings- och regressionsaktiviteter.

Den här SVM-modellen är en övervakad inlärningsmodell som kräver etiketterade data. I träningsprocessen analyserar algoritmen indata och identifierar mönster i ett flerdimensionellt funktionsutrymme som kallas hyperplanet. Alla indataexempel representeras som punkter i det här utrymmet och mappas till utdatakategorier på ett sådant sätt att kategorierna delas upp med en så bred och tydlig lucka som möjligt.

För förutsägelse tilldelar SVM-algoritmen nya exempel till en kategori eller en annan och mappar dem till samma utrymme.

Konfigurera

För den här modelltypen rekommenderar vi att du normaliserar datamängden innan du använder den för att träna klassificeraren.

  1. Lägg till komponenten Stödvektordator för två klasser i pipelinen.

  2. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa träningsläge .

    • Enskild parameter: Om du vet hur du vill konfigurera modellen kan du ange en specifik uppsättning värden som argument.

    • Parameterintervall: Om du inte är säker på de bästa parametrarna kan du hitta de optimala parametrarna med hjälp av komponenten Tune Model Hyperparameters . Du anger ett visst värdeintervall och utbildaren itererar över flera kombinationer av inställningarna för att fastställa vilken kombination av värden som ger det bästa resultatet.

  3. För Antal iterationer skriver du ett tal som anger antalet iterationer som används när modellen skapas.

    Den här parametern kan användas för att styra avvägning mellan träningshastighet och noggrannhet.

  4. För Lambda anger du ett värde som ska användas som vikt för L1-regularisering.

    Den här regulariseringskoefficienten kan användas för att finjustera modellen. Större värden straffar mer komplexa modeller.

  5. Välj alternativet Normalisera funktioner om du vill normalisera funktioner innan du tränar.

    Om du tillämpar normalisering centreras datapunkter före träningen efter medelvärdet och skalas så att de har en standardavvikelseenhet.

  6. Välj alternativet Projekt till enhetsfären för att normalisera koefficienter.

    Att projicera värden till enhetsutrymme innebär att datapunkter före träning centreras till 0 och skalas så att de har en standardavvikelseenhet.

  7. I Slumptalsutsäde anger du ett heltalsvärde som ska användas som ett frö om du vill säkerställa reproducerbarhet mellan körningar. Annars används ett systemklockavärde som ett frö, vilket kan resultera i något olika resultat mellan körningar.

  8. Anslut en märkt datauppsättning och träna modellen:

    • Om du ställer in Läget Skapa tränareEnskild parameter ansluter du en taggad datauppsättning och komponenten Träna modell .

    • Om du anger Skapa träningsläge till Parameterintervall ansluter du en taggad datauppsättning och tränar modellen med hjälp av Tune Model Hyperparameters.

    Kommentar

    Om du skickar ett parameterintervall till Train Model används endast standardvärdet i listan med enskilda parametrar.

    Om du skickar en enskild uppsättning parametervärden till komponenten Tune Model Hyperparameters ignoreras värdena när det förväntar sig ett intervall med inställningar för varje parameter och använder standardvärdena för eleven.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för valfri parameter används det enskilda värdet som du angav under hela svepet, även om andra parametrar ändras över ett värdeintervall.

  9. Skicka pipelinen.

Resultat

När träningen är klar:

  • Om du vill spara en ögonblicksbild av den tränade modellen väljer du fliken Utdata i den högra panelen i komponenten Träna modell . Välj ikonen Registrera datauppsättning för att spara modellen som en återanvändbar komponent.

  • Om du vill använda modellen för bedömning lägger du till komponenten Poängsätta modell i en pipeline.

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Machine Learning.