Konvertera till ARFF
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Konverterar indata till attributrelationsfilformatet som används av Weka-verktygsuppsättningen
Kategori: Dataformatkonverteringar
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Modulöversikt
I den här artikeln beskrivs hur du använder modulen Convert to ARFF (Konvertera till ARFF) i Machine Learning Studio (klassisk) för att konvertera datauppsättningar och skapa ett attributrelationsfilformat som används av Weka-verktygsuppsättningen. Det här formatet kallas ARFF.
ARFF-dataspecifikationen för Weka stöder flera maskininlärningsuppgifter, inklusive förbearbetning av data, klassificering och val av funktioner. I det här formatet ordnas data efter entiter och deras attribut och finns i en enda textfil. Du hittar information om Weka-filformatet i avsnittet Tekniska anteckningar.
I allmänhet krävs konvertering till Weka-filformatet endast om du vill använda både Machine Learning och Weka och planerar att flytta dina träningsdata fram och tillbaka mellan dem.
Mer information om Weka-verktygsuppsättningen finns i den här Wikipedia-artikeln: Weka (maskininlärning)
Varning
Du kan inte skriva över en befintlig ARFF-fil i Azure Storage.
Så här använder du Konvertera till ARFF
Lägg till modulen Konvertera till ARFF i experimentet. Du hittar den här modulen i kategorin Dataformatkonverteringar i Machine Learning Studio (klassisk).
Anslut den till valfri modul som matar ut en datauppsättning.
Kör experimentet eller klicka på modulen Konvertera till ARFF och klicka på Kör valt.
Resultat
Om du vill skapa en kopia av data i en lokal mapp dubbelklickar du på utdata från Konvertera till ARFF och väljer alternativet Ladda ned.
Om du inte anger någon mapp används ett standardfilnamn och filen sparas i det lokala biblioteket Hämtade filer.
Anteckning
Den här modulen stöder inte export till Python eller R-kod.
Exempel
Det finns inga exempel som är specifika för det här formatet i Azure AI Gallery. Dessa experiment visar dock andra typer av formatkonvertering:
Färgbaserad bildkomprimering: Exporterar de datauppsättningar som används för varje del av analysen till filer för reproducerbarhet och användning på andra analysplattformar.
Exempel på korsvalidering för binär klassificering: Exporterar resultaten av korsvalidering till filer så att resultaten för flera modeller kan jämföras med hjälp av ett verktyg som Excel.
Teknisk information
Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.
Exempel på ARFF-format
Det här avsnittet innehåller ett exempel på hur en typisk datauppsättning skulle se ut när den konverteras till ARFF.
Normalt består en ARFF-datafil av två avsnitt: en rubrik som definierar datakällan och schemat och dataavsnittet, som innehåller de faktiska entiteterna och deras attribut.
ARFF-rubrik
Rubriken för en ARFF-fil definierar listan över attributen (i kolumner) och deras datatyper. Rubriken kan också innehålla flera kommentarsrader som beskriver datakällan eller andra anteckningar.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Tips
Om datauppsättningen som du konverterar inte har kolumnnamn använder du modulen Redigera metadata för att lägga till kolumnnamn innan du konverterar till ARFF.
ARFF-data
Dataavsnittet består av kommaavgränsade värden och ser ut ungefär som en CSV-fil utan kolumnrubriker.
@DATA 5.1,3.5,1.4,0.2,0
Mer information om det här filformatet finns på Weka Wiki-sidan: ARFF (utvecklarversion).
Aktuell ARFF-version
Machine Learning Studio (klassisk) sparar ARFF-filer med formatet ARFF 3.0.
Förväntade indata
Namn | Typ | Description |
---|---|---|
Datamängd | Datatabell | Indatauppsättning |
Utdata
Namn | Typ | Description |
---|---|---|
Resultatdatauppsättning | Arff | Utdatauppsättning |