Analiza tekstu
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
W tym artykule opisano moduły analizy tekstu zawarte w programie Machine Learning Studio (wersja klasyczna). Te moduły zapewniają wyspecjalizowane narzędzia obliczeniowe do pracy z tekstem ze strukturą i bez struktury, w tym:
- Wiele opcji wstępnego przetwarzania tekstu.
- Wykrywanie języka.
- Tworzenie funkcji tekstu przy użyciu dostosowywalnych słowników n-gramowych.
- Funkcja wyznaczania wartości skrótu, aby efektywnie analizować tekst bez wstępnego przetwarzania ani zaawansowanej analizy językowej.
- Vowpal Wabbit, który zapewnia bardzo szybkie uczenie maszynowe tekstu. Vowpal Wabbit obsługuje skróty funkcji, modelowanie tematów (LDA) i klasyfikację.
- Rozpoznawanie jednostek nazwanych w celu wyodrębnienia nazw osób, miejsc i organizacji z tekstu bez struktury.
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Przykłady
Przykłady analizy tekstu przy użyciu Machine Learning, zobacz Azure AI Gallery:
Kategoryzacja wiadomości: używa funkcji wyznaczania wartości skrótu do klasyfikowania artykułów na wstępnie zdefiniowaną listę kategorii.
Znajdź podobne firmy: używa tekstu artykułów w Wikipedii do kategoryzowania firm.
Klasyfikacja tekstu: pokazuje, jak end-to-end korzystać z tekstu z wiadomości w serwisie Twitter w analizie tonacji (przykład z pięcioma częściami).
Lista modułów
Kategoria analiza tekstu w programie Machine Learning Studio (wersja klasyczna) obejmuje następujące moduły:
- Wykrywanie języków: wykrywa język każdego wiersza w pliku wejściowym.
- Wyodrębnianie kluczowych fraz z tekstu: wyodrębnia kluczowe frazy z danego tekstu.
- Wyodrębnianie funkcji N-Gram z tekstu: tworzy funkcje słownika N-Gram i na nich zaznacza cechy.
- Skrót funkcji: konwertuje dane tekstowe na funkcje zakodowane w postaci liczb całkowitych przy użyciu biblioteki Vowpal Wabbit.
- Alokacja ukrytego dirichletu: wykonuje modelowanie tematu przy użyciu biblioteki Vowpal Wabbit dla LDA.
- rozpoznawanie jednostek nazwanych: rozpoznaje nazwane jednostki w kolumnie tekstowej.
- Wstępne przetwarzanie tekstu: wykonuje operacje czyszczenia tekstu.
- Score Vowpal Wabbit 7-4 Model :Scores input from Azure by using version 7-4 of the Vowpal Wabbit machine learning system (Ocenianie danych wejściowych z platformy Azure przy użyciu wersji 7–4 systemu uczenia maszynowego Vowpal Wabbit).
- Score Vowpal Wabbit 7-10 Model : Scores input from Azure by using version 7-10 of the Vowpal Wabbit machine learning system (Ocenianie danych wejściowych z platformy Azure przy użyciu wersji 7–10 systemu uczenia maszynowego Vowpal Wabbit).
- Score Vowpal Wabbit 8 Model :Scores input from Azure by using version 8 of the Vowpal Wabbit machine learning system (Ocenianie danych wejściowych z platformy Azure przy użyciu wersji 8 systemu uczenia maszynowego Vowpal Wabbit).
- Trenowanie modelu Vowpal Wabbit 7-4: szkolenie modelu przy użyciu wersji 7–4 systemu uczenia maszynowego Vowpal Wabbit.
- Trenowanie modelu Vowpal Wabbit 7-10: szkolenie modelu przy użyciu wersji 7–10 systemu uczenia maszynowego Vowpal Wabbit.
- Trenowanie modelu Vowpal Wabbit 8: szkolenie modelu przy użyciu wersji 8 systemu uczenia maszynowego Vowpal Wabbit.