Dela via


Machine Learning – Poäng

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

I det här avsnittet visas modulerna i Machine Learning Studio (klassisk) för bedömning.

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Bedömning kallas även förutsägelse och är en process för att generera värden baserat på en tränad maskininlärningsmodell, givet vissa nya indata. De värden eller poäng som skapas kan representera förutsägelser av framtida värden, men de kan också representera en trolig kategori eller ett troligt resultat. Poängens betydelse beror på vilken typ av data du anger och vilken typ av modell du har skapat.

Skapa och använda modeller i Machine Learning Studio (klassisk)

Det typiska arbetsflödet för maskininlärning omfattar följande faser:

  • Välja en lämplig algoritm och ange inledande alternativ.
  • Träna modellen på kompatibla data.
  • Skapa förutsägelser med hjälp av nya data, baserat på modellens mönster.
  • Utvärdera modellen för att avgöra om förutsägelserna är korrekta, hur många fel det finns och om det finns någon överanpassad.

Machine Learning Studio (klassisk) stöder ett flexibelt, anpassningsbart ramverk för maskininlärning. Varje uppgift i den här processen utförs av en specifik typ av modul som kan ändras, läggas till eller tas bort utan att resten av experimentet bryts.

Modulerna i det här avsnittet innehåller verktyg för bedömning. I den här fasen av maskininlärning tillämpar du en tränad modell på nya data för att generera förutsägelser. Du kan antingen skicka dessa förutsägelser till ett program som förbrukar maskininlärningsresultat eller använda resultatet av bedömning för att utvärdera modellens precision och användbarhet.

Mer om bedömning

Poängsättning används ofta inom maskininlärning för att innebära processen att generera nya värden, givet en modell och vissa nya indata. Den allmänna termen "poäng" används i stället för "förutsägelse", eftersom bedömningsprocessen kan generera så många olika typer av värden:

  • En lista över rekommenderade objekt och en likhetspoäng.
  • Numeriska värden för tidsseriemodeller och regressionsmodeller.
  • Ett sannolikhetsvärde som anger sannolikheten att nya indata tillhör en befintlig kategori.
  • Namnet på en kategori eller ett kluster som ett nytt objekt är mest likt.
  • En förutsagd klass eller ett resultat för klassificeringsmodeller.

Anteckning

Du kanske också har hört ordet poäng som används för att betyda en vikt eller ett värde som tilldelats som ett resultat av dataanalysen. I Machine Learning Studio (klassisk) anger bedömning dock vanligtvis processen att generera förutsagda värden från nya data.

När du lägger till en av dessa moduler i experimentet måste du koppla en redan tränad maskininlärningsmodell och några nya data. När du kör experimentet eller den valda modulen matar bedömningsmodulen in nya data, beräknar poäng baserat på modellen och returnerar poängen i en tabell.

Data som används för bedömning

De nya data som du anger som indata måste vanligtvis ha samma kolumner som användes för att träna modellen, minus etiketten eller utfallskolumnen.

Kolumner som endast används som identifierare undantas vanligtvis när du tränar en modell, och bör därför uteslutas vid bedömning. Identifierare som primära nycklar kan dock enkelt kombineras med bedömningsdatamängden senare med hjälp av modulen Lägg till kolumner. Den här modulen fungerar utan att du behöver ange en kopplingsnyckel, så länge datauppsättningens storlek inte har ändrats.

Innan du utför bedömning på datauppsättningen ska du alltid söka efter saknade värden och nullvärden. När data som används som indata för bedömning har saknade värden används de saknade värdena som indata. Eftersom nullvärden sprids är resultatet vanligtvis ett värde som saknas.

Lista över bedömningsmoduler

Machine Learning Studio (klassisk) innehåller många olika bedömningsmoduler. Du väljer en beroende på vilken typ av modell du använder eller vilken typ av bedömningsuppgift du utför:

  • Tillämpa transformering: Tillämpar en väl angiven datatransformering på en datauppsättning.

    Använd den här modulen för att tillämpa en sparad process på en uppsättning data.

  • Tilldela data till kluster: Tilldelar data till kluster med hjälp av en befintlig tränad klustringsmodell.

    Använd den här modulen om du vill klustra nya data baserat på en befintlig K-Means-klustringsmodell.

    Den här modulen ersätter modulen Tilldela till kluster (inaktuell), som har gjorts inaktuell men fortfarande är tillgänglig för användning i befintliga experiment.

  • Poängmatchbox-rekommenderare: Poängförutsägelser för en datauppsättning med hjälp av Matchbox-rekommenderaren.

    Använd den här modulen om du vill generera rekommendationer, hitta relaterade objekt eller användare eller förutsäga klassificeringar.

  • Poängmodell: Poängförutsägelser för en tränad klassificerings- eller regressionsmodell.

    Använd den här modulen för alla andra regressions- och klassificeringsmodeller samt vissa modeller för avvikelseidentifiering.

  • Särskilda bedömningsmoduler tillhandahålls för Vowpal Wabbit. Se Textanalys.
  • Du kan poängbe poäng för särskilda klasser av bilder på förtränade modeller med hjälp av OpenCV-biblioteket.
  • Modulen Time Series Anomaly Detection genererar poäng som representerar potentiella avvikelser från en trend.

Exempel

De här exemplen i Azure AI Gallery visar processen för bedömning, från grundläggande till avancerade scenarier:

Följande artiklar innehåller verkliga exempel på hur du kan använda en maskininlärningsmodell för bedömning:

Se även