Textanalys
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
I den här artikeln beskrivs de textanalysmoduler som ingår i Machine Learning Studio (klassisk). Dessa moduler innehåller specialiserade beräkningsverktyg för att arbeta med både strukturerad och ostrukturerad text, inklusive:
- Flera alternativ för förbearbetning av text.
- Språkidentifiering.
- Skapa funktioner från text med anpassningsbara n-gram-ordlistor.
- Funktionshashing för att effektivt analysera text utan förbearbetning eller avancerad språklig analys.
- Vowpal Wabbit, för mycket snabb maskininlärning i text. Vowpal Wabbit stöder funktions-hashing, ämnesmodellering (LDA) och klassificering.
- Namngiven entitetsigenkänning för att extrahera namn på personer, platser och organisationer från ostrukturerad text.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Exempel
Exempel på textanalys med Machine Learning finns i Azure AI Gallery:
Nyhetskategorisering: Använder funktionshashing för att klassificera artiklar i en fördefinierad lista över kategorier.
Hitta liknande företag: Använder texten i Wikipedia-artiklar för att kategorisera företag.
Textklassificering: Visar processen från slutet till slut med att använda text från Twitter-meddelanden i attitydanalys (femdelsexempel).
Lista över moduler
Kategorin Textanalys i Machine Learning Studio (klassisk) innehåller följande moduler:
- Identifiera språk: Identifierar språket för varje rad i indatafilen.
- Extrahera nyckelfraser från text: Extraherar nyckelfraser från en viss text.
- Extrahera N-Gram-funktioner från text: Skapar N-Gram-ordlistefunktioner och gör funktionsval på dem.
- Funktionshashing: Konverterar textdata till heltalskodade funktioner med hjälp av Vowpal Wabbit-biblioteket.
- Latent Dirichlet-allokering: Utför ämnesmodellering med hjälp av Vowpal Wabbit-biblioteket för LDA.
- Igenkänning av namngiven entitet: Identifierar namngivna entiteter i en textkolumn.
- Förbearbeta text: Utför rensningsåtgärder på text.
- Score Vowpal Wabbit 7-4 Model: Poängindata från Azure med hjälp av version 7–4 av Vowpal Wabbit-maskininlärningssystemet.
- Score Vowpal Wabbit 7-10 Model: Poängindata från Azure med hjälp av version 7–10 av Vowpal Wabbit-maskininlärningssystemet.
- Score Vowpal Wabbit 8 Model: Poängdata från Azure med hjälp av version 8 av Vowpal Wabbit-maskininlärningssystemet.
- Träna Vowpal Wabbit 7-4-modell: Tränar en modell med hjälp av version 7–4 av Vowpal Wabbit-maskininlärningssystemet.
- Träna Vowpal Wabbit 7-10-modellen: Tränar en modell med hjälp av version 7–10 av Vowpal Wabbit-maskininlärningssystemet.
- Träna Vowpal Wabbit 8-modell: Tränar en modell med hjälp av version 8 av Vowpal Wabbit-maskininlärningssystemet.