Konwertowanie na ARFF
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Konwertuje dane wejściowe na format pliku relacji atrybutu używany przez zestaw narzędzi Weka
Kategoria: Konwersje formatu danych
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób używania modułu Convert to ARFF w programie Machine Learning Studio (wersja klasyczna) do konwertowania zestawów danych i tworzenia wyników w formacie pliku attribute-relation używanym przez zestaw narzędzi Weka. Ten format jest znany jako ARFF.
Specyfikacja danych ARFF dla firmy Weka obsługuje wiele zadań uczenia maszynowego, w tym przetwarzanie wstępne danych, klasyfikację i wybór funkcji. W tym formacie dane są zorganizowane wedługentytów i ich atrybutów i są zawarte w jednym pliku tekstowym. Szczegóły formatu pliku Weka można znaleźć w sekcji Uwagi techniczne.
Ogólnie rzecz biorąc, konwersja na format pliku Weka jest wymagana tylko wtedy, gdy chcesz używać zarówno programów Machine Learning, jak i Weka i zamierzasz przenosić dane szkoleniowe między nimi.
Aby uzyskać więcej informacji na temat zestawu narzędzi Weka, zobacz artykuł w Wikipedii: Weka (uczenie maszynowe)
Ostrzeżenie
Nie można zastąpić istniejącego pliku ARFF w usłudze Azure Storage.
Jak używać konwersji na ARFF
Dodaj moduł Convert to ARFF (Konwertuj na ARFF) do eksperymentu. Ten moduł można znaleźć w kategorii Konwersje formatu danych w programie Machine Learning Studio (wersja klasyczna).
Połączenie do dowolnego modułu, który wyprowadza zestaw danych.
Uruchom eksperyment lub kliknij moduł Convert to ARFF (Konwertuj na ARFF), a następnie kliknij pozycję Run selected (Uruchom wybraną).
Wyniki
Aby utworzyć kopię danych w folderze lokalnym, kliknij dwukrotnie dane wyjściowe konwertuj na ARFF, a następnie wybierz opcję Pobierz.
Jeśli nie określisz folderu, zostanie zastosowana domyślna nazwa pliku, a plik zostanie zapisany w lokalnej bibliotece Pobrane .
Uwaga
Ten moduł nie obsługuje eksportowania do kodu w języku Python lub R.
Przykłady
Nie ma żadnych przykładów specyficznych dla tego formatu w Azure AI Gallery. Jednak te eksperymenty pokazują inne typy konwersji formatu:
Kompresja obrazów oparta na kolorach: eksportuje zestawy danych używane dla każdej części analizy do plików w celu odtwarzania i używania na innych platformach analitycznych.
Krzyżowe sprawdzanie poprawności dla przykładu klasyfikacji binarnej: eksportuje wyniki krzyżowej weryfikacji do plików, dzięki czemu wyniki dla wielu modeli można porównać za pomocą narzędzia, takiego jak Excel.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.
Przykład formatu ARFF
Ta sekcja zawiera przykładowy wygląd typowego zestawu danych po przekonwertowaniu na arff.
Zazwyczaj plik danych ARFF składa się z dwóch sekcji: nagłówka definiującego źródło danych i schemat oraz sekcji danych, która zawiera rzeczywiste jednostki i ich atrybuty.
Nagłówek ARFF
Nagłówek pliku ARFF definiuje listę atrybutów (w kolumnach) i ich typów danych. Nagłówek może również zawierać wiele wierszy komentarzy opisujących źródło danych lub inne uwagi.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Porada
Jeśli zestaw danych, który konwertujesz, nie ma nazw kolumn, użyj modułu Edit Metadata (Edytowanie metadanych), aby dodać nazwy kolumn przed użyciem konwersji na ARFF.
Dane ARFF
Sekcja danych składa się z wartości rozdzielanych przecinkami i wygląda bardzo podobnie do pliku CSV bez nagłówków kolumn.
@DATA 5.1,3.5,1.4,0.2,0
Aby uzyskać dodatkowe informacje na temat tego formatu pliku, zobacz stronę Weka Wiki: ARFF (wersja dewelopera).
Bieżąca wersja ARFF
Machine Learning Studio (wersja klasyczna) zapisuje pliki ARFF przy użyciu formatu ARFF 3.0.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Zestaw danych | Tabela danych | Wejściowy zestaw danych |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Zestaw danych wyników | Arff | Wyjściowy zestaw danych |