Wprowadź składnik Dane ręcznie
W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.
Użyj składnika Enter Data Manually ( Wprowadź dane ręcznie ), aby utworzyć mały zestaw danych, wpisując wartości. Zestaw danych może zawierać wiele kolumn.
Ten składnik może być przydatny w scenariuszach, takich jak:
- Generowanie małego zestawu wartości na potrzeby testowania.
- Tworzenie krótkiej listy etykiet.
- Wpisywanie listy nazw kolumn do wstawienia w zestawie danych.
Tworzenie zestawu danych
Dodaj składnik Enter Data Manually (Wprowadź dane ręcznie) do potoku. Ten składnik można znaleźć w kategorii Dane wejściowe i wyjściowe w usłudze Azure Machine Learning.
W obszarze DataFormat wybierz jedną z następujących opcji. Te opcje określają sposób analizowania danych, które należy podać. Wymagania dotyczące każdego formatu różnią się znacznie, dlatego zapoznaj się z powiązanymi tematami.
- ARFF: Format pliku relacji atrybutów używany przez Weka.
- CSV: format wartości rozdzielonych przecinkami. Aby uzyskać więcej informacji, zobacz Konwertowanie na plik CSV.
- SVMLight: format używany przez Vowpal Wabbit i inne struktury uczenia maszynowego.
- TSV: format wartości rozdzielanych tabulatorami.
Jeśli wybierzesz format i nie podasz danych spełniających specyfikacje formatu, wystąpi błąd środowiska uruchomieniowego.
Kliknij wewnątrz pola tekstowego Dane , aby rozpocząć wprowadzanie danych. Następujące formaty wymagają szczególnej uwagi:
CSV: Aby utworzyć wiele kolumn, wklej tekst rozdzielony przecinkami lub wpisz wiele kolumn przy użyciu przecinków między polami.
Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.
Jeśli usuniesz zaznaczenie tej opcji, zostaną użyte nazwy kolumn (Col1, Col2 itd.). Nazwy kolumn można później dodawać lub zmieniać za pomocą funkcji Edytuj metadane.
TSV: aby utworzyć wiele kolumn, wklej tekst rozdzielony tabulatorami lub wpisz wiele kolumn przy użyciu kart między polami.
Jeśli wybierzesz opcję HasHeader , możesz użyć pierwszego wiersza wartości jako nagłówka kolumny.
Jeśli usuniesz zaznaczenie tej opcji, zostaną użyte nazwy kolumn (Col1, Col2 itd.). Nazwy kolumn można później dodawać lub zmieniać za pomocą funkcji Edytuj metadane.
ARFF: wklej istniejący plik formatu ARFF. Jeśli wartości są wpisywane bezpośrednio, pamiętaj, aby dodać opcjonalny nagłówek i wymagane pola atrybutu na początku danych.
Na przykład do prostej listy można dodać następujące wiersze nagłówków i atrybutów. Nagłówek kolumny to
SampleText
. Należy pamiętać, że typ ciągu nie jest obsługiwany.% Title: SampleText.ARFF % Source: Enter Data component @ATTRIBUTE SampleText NUMERIC @DATA \<type first data row here>
SVMLight: wpisz lub wklej wartości przy użyciu formatu SVMLight.
Na przykład poniższa próbka reprezentuje pierwszą kilka wierszy zestawu danych krwiodawstwa w formacie SVMLight:
# features are [Recency], [Frequency], [Monetary], [Time] 1 1:2 2:50 3:12500 4:98 1 1:0 2:13 3:3250 4:28
Po uruchomieniu składnika Enter Data Manually te wiersze są konwertowane na zestaw danych kolumn i wartości indeksu w następujący sposób:
Kolumna 1 Kolumna 2 Kolumna 3 Kolumna 4 Etykiety 0.00016 0,004 0.999961 0.00784 1 0 0,004 0.999955 0.008615 1
Wybierz Enter po każdym wierszu, aby rozpocząć nowy wiersz.
Jeśli wybierzesz Enter wiele razy, aby dodać wiele pustych wierszy końcowych, puste wiersze zostaną usunięte lub przycięte.
Jeśli tworzysz wiersze z brakującymi wartościami, zawsze możesz je odfiltrować później.
Połącz port wyjściowy z innymi składnikami i uruchom potok.
Aby wyświetlić zestaw danych, kliknij prawym przyciskiem myszy składnik i wybierz polecenie Visualize (Wizualizacja).
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.