Textanalyse
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
In diesem Artikel werden die Textanalysemodule beschrieben, die in Machine Learning Studio (klassisch) enthalten sind. Diese Module bieten spezielle Berechnungstools für die Arbeit mit strukturiertem und unstrukturiertem Text, einschließlich:
- Mehrere Optionen für die Vorverarbeitung von Text.
- Spracherkennung.
- Erstellen von Features aus Text mit anpassbaren N-Gramm-Wörterbüchern.
- Featurehashing zur effizienten Analyse von Text ohne Vorverarbeitung oder erweiterte linguistische Analyse.
- Vowpal Wabbit, für sehr schnelles maschinelles Lernen im Text. Vowpal Wabbit unterstützt Featurehashing, Themenmodellierung (Topic Modeling, LDA) und Klassifizierung.
- Erkennung benannter Entitäten, um die Namen von Personen, Orten und Organisationen aus unstrukturiertem Text zu extrahieren.
Hinweis
Gilt für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Beispiele
Beispiele für die Textanalyse mit Machine Learning finden Sie in den folgenden Azure KI-Katalog:
News-Kategorisierung: Verwendet Featurehashing, um Artikel in eine vordefinierte Liste von Kategorien zu klassifizieren.
Suchen ähnlicher Unternehmen: Verwendet den Text von Wikipedia-Artikeln, um Unternehmen zu kategorisieren.
Textklassifizierung: Veranschaulicht den End-to-End-Prozess der Verwendung von Text aus Twitter-Nachrichten in der Stimmungsanalyse (fünfteiles Beispiel).
Liste der Module
Die Textanalyse-Kategorie in Machine Learning Studio (klassisch) enthält die folgenden Module:
- Sprachen erkennen: Erkennt die Sprache jeder Zeile in der Eingabedatei.
- Schlüsselbegriffe aus Text extrahieren: Extrahiert Schlüsselbegriffe aus dem angegebenen Text.
- Extrahieren von N-Gramm-Features aus Text: Erstellt N-Gramm-Wörterbuchfeatures und führt die Featureauswahl für diese aus.
- Feature Hashing: Konvertiert Textdaten mithilfe der Vowpal Wabbit-Bibliothek in ganzzahlcodierte Features.
- Latent Dirichlet Allocation: Führt die Themenmodellierung mithilfe der Vowpal Wabbit-Bibliothek für LDA durch.
- Erkennung benannter Entitäten: Erkennt benannte Entitäten in einer Textspalte.
- Text vorverarbeiten: Führt Bereinigungsvorgänge für Text aus.
- Score Vowpal Wabbit 7-4 Model (Vowpal Wabbit 7-4-Modell): Bewertung der Eingabe aus Azure mithilfe der Version 7-4 des Vowpal Wabbit-Machine Learning-Systems.
- Score Vowpal Wabbit 7-10 Model (Vowpal Wabbit 7-10-Modell): Bewertung der Eingabe aus Azure mithilfe der Version 7-10 des Vowpal Wabbit-Machine Learning-Systems.
- Score Vowpal Wabbit 8 Model :Scores input from Azure by using version 8 of the Vowpal Wabbit machine learning system (Bewertung des Vowpal Wabbit 8-Modells): Wertet Eingaben aus Azure mit version 8 des Vowpal Wabbit-Machine Learning-Systems ab.
- Train Vowpal Wabbit 7-4 Model (Vowpal Wabbit 7-4-Modell trainieren): Trainiert ein Modell mit version 7-4 des Vowpal Wabbit-Machine Learning-Systems.
- Train Vowpal Wabbit 7-10 Model (Vowpal Wabbit 7-10-Modell trainieren): Trainiert ein Modell mithilfe der Version 7-10 des Vowpal Wabbit-Machine Learning-Systems.
- Train Vowpal Wabbit 8 Model (Vowpal Wabbit 8-Modell trainieren): Trainiert ein Modell mit Version 8 des Vowpal Wabbit-Machine Learning-Systems.