Konverteringar av dataformat
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Den här artikeln innehåller moduler som finns i Machine Learning Studio (klassisk) för att konvertera data mellan olika filformat som används i maskininlärning.
Formaten som stöds är:
- Datamängdsformatet som används i Machine Learning.
- ARFF-formatet som används av Weka. Weka är en Java-baserad uppsättning maskininlärningsalgoritmer med öppen källkod.
- SVMLight-formatet. SVMLight-formatet har utvecklats för SVMlight-ramverket för maskininlärning. Det kan också användas av Vowpal Wabbit.
- De tabbavgränsade (TSV) ochkommaavgränsade (CSV) flata filformat som stöds av de flesta relationsdatabaser. Dessa format stöds också mycket av R och Python.
När du konverterar data till dessa format kan du enkelt flytta resultat och data mellan olika ramverk för maskininlärning eller lagringsmekanismer.
Anteckning
Dessa datakonverteringsmoduler konverterar endast den fullständiga datauppsättningen till ett angivet format. Om du behöver utföra omvandling, trunkering, konvertering av datum/tid-format eller annan manipulering av värdena kan du använda modulerna i datatransformering eller se listan över relaterade uppgifter.
Vanliga scenarier för datakonvertering
Du använder vanligtvis datakonverteringsmodulerna om du behöver flytta data från ett Machine Learning-experiment till ett annat maskininlärningsverktyg eller plattform. Du kan också använda modulerna för att exportera data Machine Learning i ett format som kan användas av en databas eller andra verktyg. Till exempel:
Uppgift | Använd det här |
---|---|
Du måste spara en mellanliggande datauppsättning som ska användas Excel eller importera till en databas. | Använd CSV-modulen eller TSV-modulen för att förbereda data i rätt format. Ladda sedan ned data eller spara dem för att Azure Storage. |
Du vill återanvända data från experimentet i R- eller Python-kod. | Använd CSV-modulen eller TSV-modulen för att förbereda data. Högerklicka sedan på den konverterade datauppsättningen för att hämta Python-koden som du behöver för att komma åt datauppsättningen. |
Du portar experimentet och data mellan Weka och Machine Learning. | Använd ARFF-modulen för att förbereda data. Ladda sedan ned resultatet. |
Du måste förbereda data i SVMlight-ramverket. | Använd modulen Convert to SVMLight (Konvertera till SVMLight ) för att förbereda data. Ladda sedan ned resulterande data. |
Skapa data som ska användas med Vowpal Wabbit. | Använd SVMLight-formatet . Ändra sedan filerna enligt beskrivningen i artikeln. Spara filen i Azure Blob Storage för användning med en Vowpal Wabbit-modul i Machine Learning. |
Data är inte i tabellformat. | Coerce it to a dataset format by using the Convert to Dataset module. |
Relaterade uppgifter
Om du behöver importera data till Machine Learning eller transformera data i enskilda kolumner använder du de här modulerna innan du utför datakonverteringen:
Uppgift | Använd det här |
---|---|
Importera data från datorn till Machine Learning. | Upload datauppsättningar i CSV-format enligt beskrivningen i Importera dina träningsdata till Machine Learning Studio (klassisk). |
Importera data från en molndatakälla, inklusive Hadoop eller Azure. | Använd modulen Importera data. |
Spara maskininlärningsdatauppsättningar till Azure Blob Storage, ett Hadoop-kluster eller annan molnbaserad lagring. | Använd modulen Exportera data. |
Ändra datatypen för kolumner eller typ av kolumner till ett annat format eller en annan typ. | I Machine Learning du modulerna Redigera metadata ellerTillämpa SQL Transformation. Om du har kunskaper om R eller Python kan du prova modulerna Kör Python-skript eller Kör R-skript . |
Avrunda, gruppera eller normalisera numeriska data. | Använd modulerna Apply Math Operation (Tillämpamatematik, Gruppera data i lagerplatser) eller Normalize Data (Normalisera data ). |
Lista över moduler
Kategorin Dataformatkonverteringar innehåller följande moduler:
- Konvertera till ARFF: Konverterar indata till det attributrelationsfilformat som används av Weka-verktygsuppsättningen.
- Konvertera till CSV: Konverterar en datauppsättning till ett format med kommaavgränsade värden.
- Konvertera till datauppsättning: Konverterar indata till det interna datamängdsformat som används av Machine Learning.
- Konvertera till SVMLight: Konverterar indata till det format som används av SVMlight-ramverket.
- Konvertera till TSV: Konverterar indata till tabbavgränsat format.