Dela via


Sammanslå antal transformeringar

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skapar en uppsättning funktioner baserat på en antalstabell

Kategori: Learning med antal

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Sammanslå antal transformeringar i Machine Learning Studio (klassisk) för att kombinera två uppsättningar med count-baserade funktioner. Genom att sammanfoga två uppsättningar med relaterade antal och funktioner kan du potentiellt förbättra funktionernas täckning och distribution.

Learning från antal är särskilt användbart i stora datamängder med funktioner med hög kardinalitet. Möjligheten att kombinera flera datauppsättningar till antalsbaserade funktionsuppsättningar utan att behöva bearbeta om datauppsättningarna gör det enklare att samla in statistik på mycket stora datauppsättningar och tillämpa dem på nya datauppsättningar. Till exempel kan count-tabeller användas för att samla in information över terabyte med data. Du kan använda statistiken igen för att förbättra precisionen för förutsägelsemodeller i små datamängder.

För att sammanslå två uppsättningar med count-baserade funktioner måste funktionerna ha skapats med hjälp av tabeller som har samma schema: det vill säga att båda uppsättningarna måste använda samma kolumner och ha samma namn och datatyper.

Så här konfigurerar du sammanslagningsantalstransform

  1. Om du vill använda sammanslagna antal transformeringar måste du ha skapat minst en antalsbaserad transformering och den transformeringen måste finnas på din arbetsyta. Om du har sparat en antalsbaserad transformering från ett annat experiment tittar du i gruppen Transformeringar . Om du skapade transformeringen i det aktuella experimentet ansluter du utdata från följande moduler:

    • Byggräkningstransform. Skapar en ny antalsbaserad transformering från källdata.

    • Ändra tabellparametrar för antal. Tar en befintlig count-transformering som indata och matar ut en uppdaterad transformering.

    • Importantalstabell. Den här modulen stöder bakåtkompatibilitet med äldre experiment som använde count-based learning. Om du använde Import Count Table för att analysera fördelningen av värden i en datauppsättning och sedan konverterade värdena till funktioner med hjälp av den inaktuella count-funktionen använder du importantaltabellen för att konvertera resultatet till en transformering.

  2. Lägg till modulen Sammanslå antal transformeringar i experimentet och anslut en transformering till varje indata.

    Tips

    Den andra transformeringen är en valfri indata – du kan ansluta samma transformering två gånger eller ansluta ingenting på den andra indataporten.

  3. Om du inte vill att den andra datauppsättningen ska viktas lika med den första anger du ett värde för Faktor för brytning. Värdet som du skriver anger hur uppsättningen funktioner från den andra transformeringen ska viktas.

    Standardvärdet 1 viktar till exempel båda uppsättningarna med funktioner lika. Värdet 0,5 innebär att funktionerna i den andra uppsättningen skulle ha hälften så stor vikt som de i den första uppsättningen.

  4. Du kan också lägga till en instans av modulen Tillämpa transformering och tillämpa transformeringen på en datauppsättning.

Exempel

Exempel på hur den här modulen används finns i Azure AI Gallery:

  • Learning med antal: Binär klassificering: Visar hur du använder inlärningen med moduler för antal för att generera funktioner från kolumner med kategoriska värden för en binär klassificeringsmodell.

  • Learning med antal: Klassificering med flera klasser med NYC-taxidata: Visar hur du använder inlärningen med antal moduler för att utföra multiklassklassificering på den offentligt tillgängliga datauppsättningen för taxibilar i New York. Exemplet använder en logistisk regressions learner med flera klasser för att modellera det här problemet.

  • Learning med antal: Binär klassificering med NYC-taxidata: Visar hur du använder inlärningen med antal moduler för att utföra binär klassificering på den offentligt tillgängliga datauppsättningen för taxibilar i New York. Exemplet använder en logistisk regressions learner med två klasser för att modellera problemet.

Förväntade indata

Namn Typ Description
Tidigare beräkningstransform ITransform-gränssnitt Inventeringstransformen som ska redigeras
Ny beräkningstransform ITransform-gränssnitt Inventeringstransformeringen som ska läggas till (valfritt)

Modulparametrar

Namn Typ Intervall Valfritt Description Standardvärde
Förfallofaktor Float Obligatorisk 1.0f Faktorn som ska multipliceras med beräkningstransformeringen vid den högra indataporten

Utdata

Namn Typ Description
Sammanslagen inventeringstransform ITransform-gränssnitt Den sammanslagna transformeringen

Undantag

Undantag Description
Fel 0003 Undantag inträffar om en eller flera indata är null eller tomma.
Fel 0086 Undantag inträffar när en beräkningstransformering är ogiltig.

Se även

Learning med antal