Konwertowanie na zestaw danych
W tym artykule opisano sposób używania składnika Konwertuj na zestaw danych w projektancie usługi Azure Machine Learning w celu konwertowania dowolnych danych potoku na format wewnętrzny projektanta.
Konwersja nie jest wymagana w większości przypadków. Usługa Azure Machine Learning niejawnie konwertuje dane na natywny format zestawu danych po wykonaniu dowolnej operacji na danych.
Zalecamy zapisanie danych w formacie zestawu danych, jeśli przeprowadzono jakąś normalizację lub czyszczenie zestawu danych i chcesz upewnić się, że zmiany są używane w innych potokach.
Uwaga
Przekonwertuj na Zestaw danych zmienia tylko format danych. Nie zapisuje nowej kopii danych w obszarze roboczym. Aby zapisać zestaw danych, kliknij dwukrotnie port wyjściowy, wybierz pozycję Zapisz jako zestaw danych i wprowadź nową nazwę.
Jak używać funkcji Konwertuj na zestaw danych
Zalecamy użycie składnika Edytuj metadane do przygotowania zestawu danych przed użyciem funkcji Konwertuj na zestaw danych. Możesz dodawać lub zmieniać nazwy kolumn, dostosowywać typy danych i wprowadzać inne zmiany zgodnie z potrzebami.
Dodaj składnik Konwertuj na zestaw danych do potoku. Ten składnik można znaleźć w kategorii Przekształcanie danych w projektancie.
Połącz go z dowolnym składnikiem, który generuje zestaw danych.
Tak długo, jak dane są tabelaryczne, można je przekonwertować na zestaw danych. Obejmuje to dane ładowane za pomocą funkcji Importuj dane, dane utworzone za pomocą funkcji Wprowadź dane ręcznie lub zestawy danych przekształcone za pomocą funkcji Zastosuj przekształcenie.
Na liście rozwijanej Akcja wskaż, czy chcesz wykonać jakiekolwiek oczyszczanie danych przed zapisaniem zestawu danych:
Brak: użyj danych w następujący sposób.
SetMissingValue: ustaw określoną wartość na brakującą wartość w zestawie danych. Domyślny symbol zastępczy to znak zapytania (?), ale możesz użyć opcji Niestandardowe brakującej wartości , aby wprowadzić inną wartość. Jeśli na przykład wprowadzisz wartość taksówek dla brakującej wartości niestandardowej, wszystkie wystąpienia taksówek w zestawie danych zostaną zmienione na brakującą wartość.
ReplaceValues: użyj tej opcji, aby określić pojedynczą dokładną wartość, która ma zostać zamienina na dowolną inną dokładną wartość. Brakujące wartości lub wartości niestandardowe można zastąpić, ustawiając metodę Replace :
- Brak: wybierz tę opcję, aby zastąpić brakujące wartości w wejściowym zestawie danych. W polu Nowa wartość wprowadź wartość, która zastąpi brakujące wartości.
- Niestandardowe: wybierz tę opcję, aby zastąpić wartości niestandardowe w wejściowym zestawie danych. W polu Wartość niestandardowa wprowadź wartość, którą chcesz znaleźć. Jeśli na przykład dane zawierają ciąg
obs
używany jako symbol zastępczy dla brakujących wartości, wprowadź wartośćobs
. W polu Nowa wartość wprowadź nową wartość, aby zastąpić oryginalny ciąg ciąg.
Pamiętaj, że operacja ReplaceValues ma zastosowanie tylko do dokładnych dopasowań. Na przykład te ciągi nie będą miały wpływu na:
obs.
,obsolete
.Prześlij potok.
Wyniki
- Aby zapisać wynikowy zestaw danych o nowej nazwie, wybierz ikonę Zarejestruj zestaw danych na karcie Dane wyjściowe w prawym panelu składnika.
Uwagi techniczne
Każdy składnik, który przyjmuje zestaw danych jako dane wejściowe, może również pobierać dane w pliku CSV lub pliku TSV. Przed uruchomieniem jakiegokolwiek kodu składnika dane wejściowe są wstępnie przetworzone. Przetwarzanie wstępne jest równoważne uruchamianiu składnika Konwertuj na zestaw danych w danych wejściowych.
Nie można przekonwertować formatu SVMLight na zestaw danych.
Podczas określania niestandardowej operacji zastępowania operacja wyszukiwania i zastępowania ma zastosowanie do pełnych wartości. Częściowe dopasowania są niedozwolone. Można na przykład zastąpić wartość 3 wartością -1 lub 33, ale nie można zastąpić wartości 3 w dwucyfrowej liczbie, takiej jak 35.
W przypadku operacji zamiany niestandardowej zastąpienie nie powiedzie się w trybie dyskretnym, jeśli zostanie użyty jako zamiana dowolnego znaku, który nie jest zgodny z bieżącym typem danych kolumny.
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.