ML modułów programu Studio (klasycznego)
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Ten temat zawiera omówienie wszystkich modułów dostępnych w programie Machine Learning Studio (klasycznym), który jest interaktywnym, wizualnym obszarem roboczym do łatwego tworzenia i testowania modeli predykcyjnych.
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Co to jest moduł?
W Machine Learning Studio (klasycznej) moduł jest blokiem tworzenia eksperymentów. Każdy moduł hermetyzuje określony algorytm, funkcję lub bibliotekę kodu uczenia maszynowego, które mogą działać na danych w obszarze roboczym. Moduły są przeznaczone do akceptowania połączeń z innych modułów w celu udostępniania i modyfikowania danych.
Kod uruchamiany w każdym module pochodzi z wielu źródeł. Są to open source i języki, algorytmy opracowane przez firmę Microsoft Research oraz narzędzia do pracy z platformą Azure i innymi usługami w chmurze.
Porada
Szukasz algorytmów uczenia maszynowego? Zobacz kategorię Machine Learning, która zawiera moduły dotyczące m.in. drzew decyzyjnych, klastrowania i sieci neuronowych. Kategorie Train ( Trenuj) i Evaluate ( Ocena) obejmują moduły, które ułatwiają trenowania i testowania modeli.
Łącząc i konfigurując moduły, można utworzyć przepływ pracy, który odczytuje dane ze źródeł zewnętrznych, przygotowuje je do analizy, stosuje algorytmy uczenia maszynowego i generuje wyniki.
Po otwarciu eksperymentu w programie Machine Learning Studio (klasycznym) w okienku nawigacji po lewej stronie jest wyświetlona pełna lista bieżących modułów. Przeciągnij te bloki konstrukcyjne do eksperymentu, a następnie połącz je w celu utworzenia kompletnego przepływu pracy uczenia maszynowego nazywanego eksperymentem.
Czasami moduły są aktualizowane w celu dodania nowych funkcji lub usunięcia starszego kodu. W takim przypadku wszystkie utworzone eksperymenty korzystające z modułu będą nadal uruchamiane. Jednak przy następnym otwarciu eksperymentu zostanie wyświetlony monit o uaktualnienie modułu lub użycie innego modułu.
Przykłady
Aby uzyskać przykład sposobu tworzenia pełnego eksperymentu uczenia maszynowego, zobacz następujące samouczki:
Opracowywanie rozwiązania predykcyjnego przy użyciu Machine Learning
Tworzenie prostego eksperymentu w programie Machine Learning Studio (wersja klasyczna)
Kategorie modułów
Aby ułatwić znajdowanie powiązanych modułów, narzędzia uczenia maszynowego w programie Machine Learning Studio (klasyczne) są pogrupowane według tych kategorii.
Konwersje formatu danych
Te moduły służą do konwertowania danych na jeden z formatów używanych przez inne narzędzia lub formaty uczenia maszynowego.
-
Użyj tych modułów, aby odczytywać dane i modele ze źródeł danych w chmurze, w tym klastrów Hadoop, usługi Azure Table Storage i internetowych adresów URL. Możesz również użyć tych modułów do zapisu wyników w magazynie lub w bazie danych.
-
Użyj tych modułów, aby przygotować dane do analizy. Można zmieniać typy danych, oznaczać kolumny jako cechy lub etykiety, generować cechy oraz skalować lub normalizować dane.
-
Przekształcanie danych liczbowych pochodzących z cyfrowego przetwarzania sygnałów.
-
Używaj wspólnych rozkładów prawdopodobieństwa do tworzenia cech, które kompaktowo opisują duże zestawy danych.
-
Ta grupa udostępnia różne narzędzia do nauki o danych. Możesz na przykład usunąć lub zamienić brakujące wartości, wybrać podzbiór kolumn, dodać kolumnę lub utworzyć dwa zestawy danych.
-
Podziel zestaw danych według kryteriów lub według rozmiaru, aby utworzyć zestaw treningowy i testowy lub wyizolować określone wiersze.
-
Przekształcanie danych liczbowych.
Wybór funkcji
Te moduły mogą identyfikować najlepsze funkcje w danych przy użyciu powszechnie zbadanych metod statystycznych.
Usługa Machine Learning
Ta grupa zawiera większość algorytmów uczenia maszynowego obsługiwanych przez Machine Learning.
Zawiera również moduły przeznaczone do obsługi algorytmów przez trenowanie modeli, generowanie wyników i ocenę wydajności modelu.
-
Po wytrenowania modelu użyj tych narzędzi do mierzenia dokładności modelu.
-
Te moduły zapewniają algorytmy uczenia maszynowego, które można dostosować, ustawiając parametry. Algorytmy w tej sekcji są pogrupowane według typu:
-
Te moduły mogą przekazywać nowe dane za pośrednictwem algorytmu i generować zestaw wyników do oceny. Wyniki oceniania można również wykorzystać jako część usługi predykcyjnej.
-
Te moduły trenują zainicjowany model uczenia maszynowego na podstawie danych, które udostępnisz.
Moduły biblioteki OpenCV
Te moduły zapewniają łatwy dostęp do popularnej biblioteki open source do przetwarzania obrazów i klasyfikacji obrazów.
Moduły języka R
Użyj tych modułów, aby dodać niestandardowy kod języka R do eksperymentu lub zaimplementować model uczenia maszynowego oparty na pakiecie języka R.
Moduły języka Python
Użyj tych modułów, aby dodać niestandardowy kod języka Python do eksperymentu.
Funkcje statystyczne
Za pomocą tych modułów można obliczać rozkłady prawdopodobieństwa, tworzyć niestandardowe obliczenia i wykonywać wiele innych zadań związanych ze zmiennymi liczbymi.
Analiza tekstu
Użyj tych modułów, aby wykonać skrót funkcji i rozpoznawanie jednostek nazwanych lub wstępnie przetworzyć tekst przy użyciu narzędzi do przetwarzania języka naturalnego.
Szeregi czasowe
Użyj tych modułów, aby ocenić anomalie w trendach przy użyciu algorytmów specjalnie zaprojektowanych dla danych szeregów czasu.
Zadania powiązane
Machine Learning Studio (klasyczne) nie próbują duplikować narzędzi integracji danych obsługiwanych w innych narzędziach, takich jak Azure Data Factory. Zamiast tego moduły zapewniają funkcje specyficzne dla uczenia maszynowego:
- Normalizacja, grupowanie i skalowanie danych
- Obliczanie statystycznego rozkładu danych
- Konwersja na inne formaty uczenia maszynowego
- Importowanie danych używanych do eksperymentów uczenia maszynowego i eksportowanie wyników
- Analiza tekstu, wybór cech i redukcja wymiarów
Jeśli potrzebujesz bardziej zaawansowanych obiektów do manipulowania danymi i ich przechowywania, zobacz następujące informacje:
- Azure Data Factory: Enterprise gotowe do użycia potoki przetwarzania danych w chmurze.
- Azure SQL Database: skalowalny magazyn ze zintegrowanym dostępem do uczenia maszynowego.
- CosmosDB: magazyn danych NoSQL; importowanie danych do programu Machine Learning Studio (wersja klasyczna).
- Azure Data Lake Analytics: Rozproszona analiza danych big data.
- Stream Analytics: Przetwarzanie zdarzeń dla Internet rzeczy.
- Azure analiza tekstu: wiele opcji przetwarzania tekstu i powiązanych Cognitive Services mowy, obrazu i rozpoznawania twarzy.
- Azure Databricks: platforma analizy oparta na platformie Spark.