Import Count Table
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Importuje wcześniej utworzoną tabelę z liczbami
Kategoria: Edukacja z liczbami
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób korzystania z modułu Import Count Table w programie Machine Learning Studio (wersja klasyczna).
Celem modułu Import Count Table jest umożliwienie klientom, którzy tworzyli tabelę statystyk opartych na liczbach przy użyciu starszej wersji Machine Learning uaktualnianie eksperymentu. Ten moduł scala istniejące tabele zliczania z nowymi danymi.
Aby uzyskać ogólne informacje na temat tabel zliczania i sposobu ich tworzenia, zobacz Edukacja z liczbami.
Ważne
Ten moduł jest dostarczany wyłącznie w celu zapewnienia zgodności z poprzednimi wersjami eksperymentów, które korzystają z przestarzałej tabeli liczby kompilacji i przestarzałych modułów Count Featurizer. Zalecamy uaktualnienie eksperymentu w celu korzystania z nowszej wersji modułów w celu skorzystania z nowych funkcji.
W przypadku wszystkich nowych eksperymentów zalecamy użycie następujących modułów:
- Przekształcanie zliczania kompilacji
- Modyfikowanie parametrów zliczanych tabel
- Scalanie przekształcenia liczby
How to configure Import Count Table
W Machine Learning Studio (wersja klasyczna) otwórz eksperyment zawierający tabelę count utworzoną przy użyciu przestarzałego modułu Build Count Table .
Dodaj moduł Import Count Table (Importuj tabelę zliczania) do eksperymentu.
Połączenie dane wyjściowe modułu Build Count Table (przestarzałe) do pasujących portów wejściowych tabeli zliczania importu.
Jeśli masz inny zestaw danych z liczbami, który chcesz scalić z zaimportowaną tabelą count, połącz go z najbardziej po prawej stronie danych wejściowych modułu Import Count Table (Importuj tabelę zliczania ).
Użyj opcji Typ zliczania , aby określić, gdzie i jak jest przechowywana tabela zliczania:
Zestaw danych: dane używane do kompilowania są zapisywane jako zestaw danych w programie Machine Learning Studio (wersja klasyczna).
Obiekt blob: dane używane do kompilowania są przechowywane jako blokowy obiekt blob w Windows Azure Storage.
MapReduce: dane używane do kompilowania liczników są przechowywane jako obiekt blob w Windows Azure Storage.
Ta opcja jest zwykle preferowana w przypadku bardzo dużych zestawów danych. Aby uzyskać dostęp do liczników, należy aktywować klaster usługi HDInsight. Zostanie MapReduce zadanie w celu wykonania zliczania. Oba te działania mogą wiązać się z kosztami magazynu i zasobów obliczeniowych.
Aby uzyskać więcej informacji, zobacz HDInsight on Azure (Usługa HDInsight na platformie Azure).
Po określeniu trybu przechowywania danych może być konieczne podanie dodatkowych informacji o połączeniu dla danych, nawet jeśli wcześniej w eksperymencie był używany moduł Importuj dane w celu uzyskania dostępu do danych. Wynika to z tego, że moduł Count Featurizer (przestarzały) uzyskuje oddzielnie dostęp do magazynu danych w celu odczytania danych i skompilowania wymaganych tabel.
Użyj opcji Typ tabeli Liczba , aby określić format i tryb przechowywania tabeli używanej do przechowywania liczb.
Słownik: używa tabeli zliczanych słowników.
Wszystkie wartości kolumn w wybranych kolumnach są traktowane jako ciągi i są skrótami przy użyciu tablicy bitowej o rozmiarze do 31 bitów. W związku z tym wszystkie wartości kolumn są reprezentowane przez nieujemną 32-bitową liczbę całkowitą.
CMSketch: używa tabeli zapisanej w tabeli minimalnej liczby szkiców.
W tym formacie wiele niezależnych funkcji skrótu o mniejszym zakresie jest używanych w celu zwiększenia wydajności pamięci i zmniejszenia ryzyka kolizji skrótów.
Ogólnie rzecz biorąc, należy użyć opcji Słownik dla mniejszych zestawów danych (<1 GB) i użyć opcji CMSketch w przypadku większych zestawów danych.
Uruchom eksperyment.
Po zakończeniu kliknij prawym przyciskiem myszy dane wyjściowe modułu Import Count Table (Importuj tabelę zliczania), wybierz pozycję Save as Transform (Zapisz jako przekształcenie) i wpisz nazwę przekształcenia. Gdy to zrobisz, scalone tabele zliczania i wszelkie zastosowane parametry cechowania zostaną zapisane w formacie, który można zastosować do nowego zestawu danych.
Przykłady
Zapoznaj się z przykładami cechowania na podstawie liczby, korzystając z tych przykładowych eksperymentów w Azure AI Gallery:
Przewidywanie opóźnień lotów: pokazuje, jak cechowanie na podstawie liczby może być przydatne w bardzo dużym zestawie danych.
Edukacja z counts: Multiclass classification with NYC taxi data (Klasyfikacja wieloklasowa z danymi taksówek w NYC): pokazuje użycie funkcji opartych na liczbach w wieloklasowym zadaniu przewidywania.
Edukacja z liczbami: Klasyfikacja binarna z danymi taksówek w NYC: używa funkcji opartych na liczbach w zadaniu klasyfikacji binarnej.
Uwaga
Wszystkie te eksperymenty z galerii zostały utworzone przy użyciu starszej, a teraz przestarzałej wersji aplikacji Edukacja z modułami Counts. Po otwarciu eksperymentu w programie Studio (wersja klasyczna) eksperyment zostanie automatycznie uaktualniony w celu użycia nowszej wersji modułów.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Zlicz metadane | Tabela danych | Metadane liczników |
Tabela zliczanych | Tabela danych | Tabela zliczania |
Zliczony zestaw danych | Tabela danych | Zestaw danych używany do zliczania |
Parametry modułu
Nazwa | Typ | Zakres | Opcjonalne | Domyślny | Opis |
---|---|---|---|---|---|
Typ zliczania | Typ zliczania | Wymagane | Typ zliczania |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Przekształcanie zliczania | ITransform, interfejs | Przekształcenie zliczania |
Wyjątki
Wyjątek | Opis |
---|---|
Błąd 0003 | Wyjątek występuje, jeśli co najmniej jeden z danych wejściowych ma wartość null lub jest pusty. |
Błąd 0018 | Wyjątek występuje, jeśli wejściowy zestaw danych jest nieprawidłowy. |
Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.
Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).