Text Analytics
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
In dit artikel worden de tekstanalysemodules beschreven die zijn opgenomen in Machine Learning Studio (klassiek). Deze modules bieden gespecialiseerde rekenhulpprogramma's voor het werken met zowel gestructureerde als ongestructureerde tekst, waaronder:
- Meerdere opties voor het voorverwerken van tekst.
- Taaldetectie.
- Het maken van functies van tekst met behulp van aanpasbare n-gram-woordenlijsten.
- Hashing van functies om tekst efficiënt te analyseren zonder voorverwerking of geavanceerde taalkundige analyse.
- Vowpal Wabbit, voor zeer snelle machine learning op tekst. Vowpal Wabbit biedt ondersteuning voor functie-hashing, onderwerpmodelleren (LDA) en classificatie.
- Herkenning van benoemde entiteiten om de namen van personen, plaatsen en organisaties uit ongestructureerde tekst te extraheren.
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Voorbeelden
Zie de volgende voorbeelden voor voorbeelden van tekstanalyse Machine Learning gebruik van Azure AI Gallery:
Nieuwscategorisatie: maakt gebruik van functie-hashing om artikelen te classificeren in een vooraf gedefinieerde lijst met categorieën.
Vergelijkbare bedrijven zoeken: gebruikt de tekst van Wikipedia-artikelen om bedrijven te categoriseren.
Tekstclassificatie: demonstreert het end-to-end-proces van het gebruik van tekst uit Twitter-berichten in sentimentanalyse (voorbeeld van vijfdelige tekst).
Lijst met modules
De Text Analytics categorie in Machine Learning Studio (klassiek) bevat de volgende modules:
- Talen detecteren: detecteert de taal van elke regel in het invoerbestand.
- Sleuteltermen extraheren uit tekst: extraheert sleuteltermen uit bepaalde tekst.
- N-Gram-functies extraheren uit Tekst: hiermee worden N-Gram-woordenlijstfuncties gemaakt en worden functies geselecteerd.
- Functie-hashing: converteert tekstgegevens naar functies die zijn gecodeerd met gehele getallen met behulp van de Vowpal Wabbit-bibliotheek.
- Latent Digiftetoewijzing: voert onderwerpmodellen uit met behulp van de Vowpal Wabbit-bibliotheek voor LDA.
- Herkenning van benoemde entiteiten: herkent benoemde entiteiten in een tekstkolom.
- Tekst voorverwerken: voert opschoonbewerkingen uit op tekst.
- Score Vowpal Wabbit 7-4 Model: scores input from Azure by using version 7-4 of the Vowpal Wabbit machine learning system.
- Score Vowpal Wabbit 7-10 Model: scores input from Azure by using version 7-10 of the Vowpal Wabbit machine learning system.
- Score Vowpal Wabbit 8 Model: scores input from Azure by using version 8 of the Vowpal Wabbit machine learning system.
- Vowpal Wabbit 7-4-model trainen: traint een model met behulp van versie 7-4 van het Vowpal Wabbit machine learning systeem.
- Vowpal Wabbit 7-10-model trainen: traint een model met behulp van versie 7-10 van het Vowpal Wabbit machine learning systeem.
- Vowpal Wabbit 8-model trainen: traint een model met behulp van versie 8 van het Vowpal Wabbit machine learning systeem.