Modyfikowanie parametrów zliczanych tabel
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Modyfikuje parametry używane do tworzenia funkcji z liczników
Kategoria: Edukacja z liczbami
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób używania modułu Modyfikowanie parametrów tabeli liczby w programie Machine Learning Studio (wersja klasyczna) w celu zmiany sposobu generowania funkcji na podstawie tabeli zliczania.
Ogólnie rzecz biorąc, aby utworzyć funkcje oparte na liczbach, należy użyć funkcji Przekształcanie zliczania kompilacji do przetwarzania zestawu danych i tworzenia tabeli zliczania, a na podstawie tej tabeli zliczanej wygeneruj nowy zestaw funkcji.
Jeśli jednak utworzono już tabelę zliczaną, możesz użyć modułu Modyfikowanie parametrów tabeli zliczania, aby edytować definicję sposobu przetwarzania danych zliczania. Dzięki temu można utworzyć inny zestaw statystyk opartych na liczbach na podstawie istniejących danych bez konieczności ponownego analizowania zestawu danych.
Jak skonfigurować modyfikowanie parametrów liczby
Znajdź przekształcenie, które chcesz zmodyfikować, w grupie Przekształcenia i dodaj je do eksperymentu.
Wcześniej należy uruchomić eksperyment, który utworzył przekształcenie liczby.
Aby zmodyfikować zapisane przekształcenie: zlokalizuj przekształcenie w grupie Przekształcenia i dodaj je do eksperymentu.
Aby zmodyfikować przekształcenie liczby utworzone w ramach tego samego eksperymentu: jeśli przekształcenie nie zostało zapisane, ale jest dostępne jako dane wyjściowe w bieżącym eksperymencie (na przykład sprawdź dane wyjściowe modułu Przekształcanie zliczania kompilacji), możesz użyć go bezpośrednio, łącząc moduły.
Dodaj moduł Modify Count Table Parameters (Modyfikowanie parametrów tabeli zliczania ) i połącz przekształcenie jako dane wejściowe.
W okienku Właściwości modułu Modyfikowanie parametrów tabeli zliczaj wpisz wartość do użycia jako próg pojemnikaGarbage.
Ta wartość określa minimalną liczbę wystąpień, które muszą zostać znalezione dla każdej wartości funkcji, aby można było użyć liczb. Jeśli częstotliwość wartości jest mniejsza niż próg kosza na śmieci, para etykiety wartości nie jest liczona jako dyskretny element; Zamiast tego wszystkie elementy z liczbami niższymi niż wartość progowa są umieszczane w jednym "koszu na śmieci".
Jeśli używasz małego zestawu danych i zliczasz te same dane i trenujesz je, dobrą wartością początkową jest 1.
W przypadku dodatkowych poprzednich przykładów przykładowych wpisz liczbę, która wskazuje liczbę dodatkowych przykładów pseudo do dołączyć. Nie musisz poświadczyć tych przykładów. Przykłady pseudo są generowane na podstawie wcześniejszego rozkładu.
W przypadku skalowania szumów laplacji wpisz dodatnią wartość zmiennoprzecinkową, która reprezentuje skalę używaną do wprowadzania szumu próbkowania z rozkładu laplacian. W przypadku ustawienia wartości skalowania pewien akceptowalny poziom szumu jest uwzględniany w modelu, więc prawdopodobieństwo, że na model będzie mieć wpływ niezaznane wartości w danych, jest mniejsze.
W opcji Funkcje danych wyjściowych wybierz metodę, która ma być stosowana podczas tworzenia funkcji opartych na liczbach, które mają być dołączane do przekształcenia.
CountsOnly: utwórz funkcje przy użyciu liczników.
LogOddsOnly: utwórz funkcje przy użyciu dziennika współczynnika prawdopodobieńszy.
BothCountsAndLogOdds: Tworzenie funkcji przy użyciu liczników i prawdopodobieńszy dziennika.
Wybierz opcję Ignoruj kolumnę z powrotem ,
IsBackOff
jeśli chcesz zastąpić flagę w danych wyjściowych podczas tworzenia funkcji. Po wybraniu tej opcji funkcje oparte na liczbach są tworzone nawet wtedy, gdy kolumna nie ma znaczących wartości zliczania.Uruchom eksperyment. Następnie możesz zapisać dane wyjściowe polecenia Modyfikuj liczbę parametrów tabeli jako nowe przekształcenie, jeśli to konieczne.
Przykłady
Przykłady tego modułu można znaleźć w Azure AI Gallery:
Edukacja z liczbami: Klasyfikacja binarna: pokazuje, jak używać modułów uczenia z liczbami do generowania funkcji na podstawie kolumn wartości kategorii dla binarnego modelu klasyfikacji.
Edukacja z liczbami: Klasyfikacja wieloklasowa z danymi taksówek w NYC:sample Przedstawia sposób użycia modułów uczenia z liczbami do wykonywania klasyfikacji wieloklasowej na publicznie dostępnym zestawie danych dotyczących taksówek w NYC. W przykładzie użyto wieloklasowej klasy uczenia regresji logistycznej do modelowania tego problemu.
Edukacja z liczbami: Klasyfikacja binarna z danymi taksówek w NYC: pokazuje, jak używać modułów uczenia się z liczbami do przeprowadzania klasyfikacji binarnej na publicznie dostępnym zestawie danych dotyczących taksówek w NYC. W przykładzie użyto dwuklasowej klasy uczenia regresji logistycznej do modelowania tego problemu.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.
W przypadku ustawienia parametru skalowania szumu laplacianego jest statystycznie bezpieczne zliczane i trenowanie na tym samym zestawie danych.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Przekształcanie zliczania | ITransform, interfejs | Przekształcenie zliczania do zastosowania |
Parametry modułu
Nazwa | Typ | Zakres | Opcjonalne | Domyślny | Opis |
---|---|---|---|---|---|
Próg kosza na śmieci | Float | >= 0,0f | Wymagane | 10,0f | Próg, w ramach którego wartość kolumny będzie cechowana względem kosza na śmieci |
Dodatkowe wcześniejsze przykłady przykładów | Float | >= 0,0f | Wymagane | 42,0f | Dodatkowe przykłady przykładów po poprzednich dystrybucjach, które mają zostać uwzględnione |
Skala szumu laplacji | Float | >= 0,0f | Wymagane | 0,0f | Skala rozkładu Laplacian, z którego próbkowane są szumy |
Funkcje wyjściowe obejmują | OutputFeatureType | Wymagane | BothCountsAndLogOdds | Funkcje, które mają być wyprowadzane | |
Ignoruj kolumnę z powrotem | Wartość logiczna | Wymagane | fałsz | Czy zignorować kolumnę IsBackOff w danych wyjściowych |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Zmodyfikowane przekształcenie | ITransform, interfejs | Zmodyfikowane przekształcenie |
Wyjątki
Wyjątek | Opis |
---|---|
Błąd 0003 | Wyjątek występuje, jeśli co najmniej jeden z danych wejściowych ma wartość null lub jest pusty. |
Błąd 0086 | Wyjątek występuje, gdy przekształcenie zliczania jest nieprawidłowe. |
Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.
Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).