Extrahera nyckelfraser från text

Artikel
05/06/2019

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Extraherar nyckelfraser från en viss text

Kategori: Textanalys

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln förklarar hur du använder modulen Extrahera nyckelfraser från text i Machine Learning Studio (klassisk) för att bearbeta en textkolumn i förväg. Med en kolumn med text med naturligt språk extraherar modulen en eller flera meningsfulla fraser. En fras kan vara ett enda ord, ett sammansatt substantiv eller en modifierare plus ett substantiv.

Den här modulen är en omser för bearbetning av API:er för naturligt språk för extrahering av nyckelfraser. Fraserna analyseras som potentiellt meningsfulla i kontexten för meningen av olika skäl:

Frasen fångar upp ämnet i meningen.
Frasen innehåller en kombination av modifierare och substantiv som anger sentiment.

Anta till exempel att den analyserade meningen är: "Det var ett fantastiskt hotell att bo på, med unik känsla och vänlig personal."

Modulen Extrahera nyckelfraser från text kan returnera dessa nyckelfraser:

fantastiska hotell
vänlig personal
unik unika

Så här konfigurerar du extrahering av nyckelfraser från text

Om du vill extrahera nyckelfraser måste du ansluta en datauppsättning som har en kolumn med text.

Lägg till modulen Extrahera nyckelfraser från text i experimentet i Machine Learning Studio (klassisk). Anslut sedan en datauppsättning som har minst en fulltextkolumn.
Använd kolumnväljaren för att välja en kolumn av typen sträng som du vill extrahera nyckelfraser från.
För Språk väljer du ett språk som ska användas vid analys av fraser. Om du anger ett språk matas endast fraser i målspråket ut.
Om textkolumnen innehåller fraser på flera språk väljer du alternativet Språk som identifierats i kolumner. En ny kolumnväljare visas där du kan välja en kolumn i datauppsättningen som innehåller en språkidentifierare. Språkidentifieraren kan antingen vara språknamnet eller iso6391-kulturidentifieraren. Till exempel är "engelska" eller "en" godtagbara.

Tips

Innan du kör Extrahera nyckelfraser från text använder du modulen Identifiera språk för att identifiera språket på varje rad och generera identifieraren åt dig. Ett fel uppstår om kolumnen för språkidentifierare innehåller språk som inte stöds av Extrahera nyckelfraser från text.

Resultat

Utdata från modulen är en datauppsättning som innehåller en kolumn med kommaavgränsade nyckelfraser.

Följande exempelresultat är till exempel för en indatauppsättning som innehåller granskningar på flera språk:

Nyckelfraser
roman, lycksent, bra bok, adventure story, avalanche av händelser, bra tecken
primer primer primerio,personajes,fan,aventura,isla

Alla utdatafraser finns i en enda kolumn. inga andra kolumner skickas och ingen identifierare läggs till. Men om du vill justera utdatafraserna med källtexten kan du kombinera utdatafraserna med indata med hjälp av modulen Lägg till kolumner.
Utdata från extrahering av nyckelfraser flaggar inte språket för enskilda fraser.
Om ett språk ingår som inte stöds av modulen Extrahera nyckelfraser utlöses ett fel (0039). För att undvika fel måste du filtrera bort indatatext som har en inkompatibel språkidentifierare.

Om det finns mycket få rader med andra språk kan du också undvika felet genom att utelämna språkidentifieraren och analysera all text med ett enda språkval. Men när du gör det blir resultatet mycket dåligt eftersom hela meningar på de andra språken kan matas ut som en enda nyckelfras.

Exempel

Följande exempel visar hur du använder den här modulen för att extrahera nyckelfraser och sedan skapa ett ordmoln från fraserna: Extrahera nyckelfraser och Visa ordmoln

Se Azure AI Gallery fler exempel på textbearbetning med hjälp av Machine Learning.

Teknisk information

Den här modulen stöder för närvarande följande språk:

Nederländska
Engelska
Franska
Tyska
Italienska
Spanska

Överväg att använda API:et för Textanalys språk i Azure Cognitive Services. Mer information finns i Extrahera nyckelfraser i Textanalys

Förväntade indata

Namn	Typ	Description
Datamängd	Datatabell	Tabellen som innehåller texten som ska bearbetas.

Modulparametrar

Namn	Typ	Intervall	Valfritt	Standardvärde	Description
Kolumnen Kulturspråk	ColumnSelection		language:Kolumnen innehåller språk		Namn eller ett baserat index för kolumnen som innehåller information om kulturspråket
Textkolumn	ColumnSelection		Obligatorisk		Namn eller ett baserat index för textkolumnen.
Språk	T_Language	Engelska, spanska, franska, nederländska, tyska, italienska, kolumn innehåller språk	Obligatorisk	Engelska	Välj språket för texten som ska bearbetas.

Utdata

Namn	Typ	Description
Resultatdatauppsättning	Datatabell	De extraherade nyckelfraserna

Undantag

Undantag	Description
Fel 0003	Undantag inträffar om en eller flera indata är null eller tomma.
Fel 0010	Undantag inträffar om indatauppsättningar har kolumnnamn som ska matcha men inte.
Fel 0016	Undantaget inträffar om indatauppsättningar som skickas till modulen ska ha kompatibla kolumntyper men inte göra det.
Fel 0008	Undantaget inträffar om parametern inte är inom intervallet.

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Se även

Textanalys
A-Z-modullista

Dela via