Extrahera nyckelfraser från text
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Extraherar nyckelfraser från en viss text
Kategori: Textanalys
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Modulöversikt
Den här artikeln förklarar hur du använder modulen Extrahera nyckelfraser från text i Machine Learning Studio (klassisk) för att bearbeta en textkolumn i förväg. Med en kolumn med text med naturligt språk extraherar modulen en eller flera meningsfulla fraser. En fras kan vara ett enda ord, ett sammansatt substantiv eller en modifierare plus ett substantiv.
Den här modulen är en omser för bearbetning av API:er för naturligt språk för extrahering av nyckelfraser. Fraserna analyseras som potentiellt meningsfulla i kontexten för meningen av olika skäl:
- Frasen fångar upp ämnet i meningen.
- Frasen innehåller en kombination av modifierare och substantiv som anger sentiment.
Anta till exempel att den analyserade meningen är: "Det var ett fantastiskt hotell att bo på, med unik känsla och vänlig personal."
Modulen Extrahera nyckelfraser från text kan returnera dessa nyckelfraser:
- fantastiska hotell
- vänlig personal
- unik unika
Så här konfigurerar du extrahering av nyckelfraser från text
Om du vill extrahera nyckelfraser måste du ansluta en datauppsättning som har en kolumn med text.
Lägg till modulen Extrahera nyckelfraser från text i experimentet i Machine Learning Studio (klassisk). Anslut sedan en datauppsättning som har minst en fulltextkolumn.
Använd kolumnväljaren för att välja en kolumn av typen sträng som du vill extrahera nyckelfraser från.
För Språk väljer du ett språk som ska användas vid analys av fraser. Om du anger ett språk matas endast fraser i målspråket ut.
Om textkolumnen innehåller fraser på flera språk väljer du alternativet Språk som identifierats i kolumner. En ny kolumnväljare visas där du kan välja en kolumn i datauppsättningen som innehåller en språkidentifierare. Språkidentifieraren kan antingen vara språknamnet eller iso6391-kulturidentifieraren. Till exempel är "engelska" eller "en" godtagbara.
Tips
Innan du kör Extrahera nyckelfraser från text använder du modulen Identifiera språk för att identifiera språket på varje rad och generera identifieraren åt dig. Ett fel uppstår om kolumnen för språkidentifierare innehåller språk som inte stöds av Extrahera nyckelfraser från text.
Resultat
Utdata från modulen är en datauppsättning som innehåller en kolumn med kommaavgränsade nyckelfraser.
Följande exempelresultat är till exempel för en indatauppsättning som innehåller granskningar på flera språk:
Nyckelfraser |
---|
roman, lycksent, bra bok, adventure story, avalanche av händelser, bra tecken |
primer primer primerio,personajes,fan,aventura,isla |
Alla utdatafraser finns i en enda kolumn. inga andra kolumner skickas och ingen identifierare läggs till. Men om du vill justera utdatafraserna med källtexten kan du kombinera utdatafraserna med indata med hjälp av modulen Lägg till kolumner.
Utdata från extrahering av nyckelfraser flaggar inte språket för enskilda fraser.
Om ett språk ingår som inte stöds av modulen Extrahera nyckelfraser utlöses ett fel (0039). För att undvika fel måste du filtrera bort indatatext som har en inkompatibel språkidentifierare.
Om det finns mycket få rader med andra språk kan du också undvika felet genom att utelämna språkidentifieraren och analysera all text med ett enda språkval. Men när du gör det blir resultatet mycket dåligt eftersom hela meningar på de andra språken kan matas ut som en enda nyckelfras.
Exempel
Följande exempel visar hur du använder den här modulen för att extrahera nyckelfraser och sedan skapa ett ordmoln från fraserna: Extrahera nyckelfraser och Visa ordmoln
Se Azure AI Gallery fler exempel på textbearbetning med hjälp av Machine Learning.
Teknisk information
Den här modulen stöder för närvarande följande språk:
- Nederländska
- Engelska
- Franska
- Tyska
- Italienska
- Spanska
Överväg att använda API:et för Textanalys språk i Azure Cognitive Services. Mer information finns i Extrahera nyckelfraser i Textanalys
Förväntade indata
Namn | Typ | Description |
---|---|---|
Datamängd | Datatabell | Tabellen som innehåller texten som ska bearbetas. |
Modulparametrar
Namn | Typ | Intervall | Valfritt | Standardvärde | Description |
---|---|---|---|---|---|
Kolumnen Kulturspråk | ColumnSelection | language:Kolumnen innehåller språk | Namn eller ett baserat index för kolumnen som innehåller information om kulturspråket | ||
Textkolumn | ColumnSelection | Obligatorisk | Namn eller ett baserat index för textkolumnen. | ||
Språk | T_Language | Engelska, spanska, franska, nederländska, tyska, italienska, kolumn innehåller språk | Obligatorisk | Engelska | Välj språket för texten som ska bearbetas. |
Utdata
Namn | Typ | Description |
---|---|---|
Resultatdatauppsättning | Datatabell | De extraherade nyckelfraserna |
Undantag
Undantag | Description |
---|---|
Fel 0003 | Undantag inträffar om en eller flera indata är null eller tomma. |
Fel 0010 | Undantag inträffar om indatauppsättningar har kolumnnamn som ska matcha men inte. |
Fel 0016 | Undantaget inträffar om indatauppsättningar som skickas till modulen ska ha kompatibla kolumntyper men inte göra det. |
Fel 0008 | Undantaget inträffar om parametern inte är inom intervallet. |
En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.
En lista över API-undantag finns i Machine Learning REST API felkoder.