Konvertera till TSV
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Konverterar indata till ett tabbavgränsat format
Kategori: Dataformatkonverteringar
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Modulöversikt
Den här artikeln beskriver hur du använder modulen Konvertera till TSV i Machine Learning Studio (klassisk) för att konvertera en datauppsättning från det interna format som används av alla moduler i Machine Learning Studio (klassisk) till en platt fil i tabbavgränsat format.
Filer med tabbavgränsade värden (TSV) är kompatibla med många externa verktyg, inklusive:
R och Python
Excel och PowerPivot
Alla relationsdatabaser
Om experimentet till exempel har en mellanliggande datauppsättning som du vill spara för återanvändning i ett annat verktyg eller vill anropa från kod konverterar du den till TSV-format och högerklickar sedan på den konverterade datauppsättningen för att få den Python-kod som behövs för att få åtkomst till datauppsättningen.
Så här använder du Konvertera till TSV
Använd modulen Konvertera till TSV när du behöver ladda ned en datauppsättning i tabbavgränsat format.
Lägg till Konvertera till TSV i experimentet. Du hittar den här modulen i kategorin Konverteringar av dataformat i Machine Learning Studio (klassisk).
Anslut modulen till en annan datset eller till en modul som matar ut en tabelldatauppsättning.
Kör experimentet eller högerklicka bara på modulen Konvertera till TSV och välj Kör valt.
Resultat
När konverteringen är klar kan du öppna datauppsättningen, anropa den från R- eller Python-kod, använda den i en Jupyter Notebook eller spara den i en lokal fil.
Om du vill ladda ned datauppsättningen dubbelklickar du på modulens utdata och anger om du vill öppna eller spara datset.
Om du väljer Öppna läses datauppsättningen in med det verktyg som datorn använder som standard för att öppna . TSV-filer. Detta är vanligtvis Microsoft Excel.
Om du väljer Ladda ned datauppsättning sparas filen som standard med namnet på modulen plus ett GUID som representerar arbetsytans ID. Du kan dock välja alternativet Spara som under nedladdningen och ändra filnamnet eller platsen.
Exempel
Även om det inte finns några exempel som är specifika för det här formatet kan du se exempel på hur formatkonvertering används genom att utforska dessa exempelexperiment i Azure AI Gallery:
Korsvalidering för exempel på binär klassificering: Exporterar resultaten av korsvalidering till formatet med kommaavgränsade värden (CSV) så att resultat för flera modeller kan jämföras med hjälp av ett verktyg som Excel.
Kvantisering av färgbaserad bildkomprimering: Exporterar de datauppsättningar som används för varje del av analysen till CSV-filer, så att du enkelt kan köra en liknande modell i alla verktyg som stöder CSV-format.
Teknisk information
Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.
Krav för TSV-format
Tabbavgränsade värden (TSV) är ett textformat som används för att lagra data i en tabellstruktur. Det liknar CSV-formatet, men avgränsaren är en flik i stället för ett kommatecken.
TSV-formatet är ett användbart alternativ till CSV-formatet om dina data innehåller kommatecken. Kommatecken är mycket vanliga i textdata och de används i europeiska talformat.
Ett problem med tabbavgränsat format är att tabbstopp ofta betraktas som blanksteg i ostrukturerad text. IANA-standarden för TSV främjar dock ren och korrekt parsning av TSV-filer genom att inte tillåta flikar i fält.
Observera följande krav för TSV-filer i Machine Learning Studio (klassisk):
Modulen Konvertera till TSV stöder utdata från en enda rubrikrad om datauppsättningen innehåller kolumnnamn.
TSV-providern stöder endast UTF-8-teckenskodning.
När du läser från eller skriver till TSV-filer kan prestandan vara långsammare än med andra format (till exempel CSV).
Förväntade indata
Namn | Typ | Description |
---|---|---|
Datamängd | Datatabell | Indatauppsättning |
Utdata
Namn | Typ | Description |
---|---|---|
Resultatdatauppsättning | GenericTsv | Utdatauppsättning |