Dela via


Konvertera till TSV

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Konverterar indata till ett tabbavgränsat format

Kategori: Dataformatkonverteringar

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Konvertera till TSV i Machine Learning Studio (klassisk) för att konvertera en datauppsättning från det interna format som används av alla moduler i Machine Learning Studio (klassisk) till en platt fil i tabbavgränsat format.

Filer med tabbavgränsade värden (TSV) är kompatibla med många externa verktyg, inklusive:

  • R och Python

  • Excel och PowerPivot

  • Alla relationsdatabaser

Om experimentet till exempel har en mellanliggande datauppsättning som du vill spara för återanvändning i ett annat verktyg eller vill anropa från kod konverterar du den till TSV-format och högerklickar sedan på den konverterade datauppsättningen för att få den Python-kod som behövs för att få åtkomst till datauppsättningen.

Så här använder du Konvertera till TSV

Använd modulen Konvertera till TSV när du behöver ladda ned en datauppsättning i tabbavgränsat format.

  1. Lägg till Konvertera till TSV i experimentet. Du hittar den här modulen i kategorin Konverteringar av dataformat i Machine Learning Studio (klassisk).

  2. Anslut modulen till en annan datset eller till en modul som matar ut en tabelldatauppsättning.

  3. Kör experimentet eller högerklicka bara på modulen Konvertera till TSV och välj Kör valt.

Resultat

När konverteringen är klar kan du öppna datauppsättningen, anropa den från R- eller Python-kod, använda den i en Jupyter Notebook eller spara den i en lokal fil.

Om du vill ladda ned datauppsättningen dubbelklickar du på modulens utdata och anger om du vill öppna eller spara datset.

  • Om du väljer Öppna läses datauppsättningen in med det verktyg som datorn använder som standard för att öppna . TSV-filer. Detta är vanligtvis Microsoft Excel.

  • Om du väljer Ladda ned datauppsättning sparas filen som standard med namnet på modulen plus ett GUID som representerar arbetsytans ID. Du kan dock välja alternativet Spara som under nedladdningen och ändra filnamnet eller platsen.

Exempel

Även om det inte finns några exempel som är specifika för det här formatet kan du se exempel på hur formatkonvertering används genom att utforska dessa exempelexperiment i Azure AI Gallery:

  • Korsvalidering för exempel på binär klassificering: Exporterar resultaten av korsvalidering till formatet med kommaavgränsade värden (CSV) så att resultat för flera modeller kan jämföras med hjälp av ett verktyg som Excel.

  • Kvantisering av färgbaserad bildkomprimering: Exporterar de datauppsättningar som används för varje del av analysen till CSV-filer, så att du enkelt kan köra en liknande modell i alla verktyg som stöder CSV-format.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Krav för TSV-format

Tabbavgränsade värden (TSV) är ett textformat som används för att lagra data i en tabellstruktur. Det liknar CSV-formatet, men avgränsaren är en flik i stället för ett kommatecken.

TSV-formatet är ett användbart alternativ till CSV-formatet om dina data innehåller kommatecken. Kommatecken är mycket vanliga i textdata och de används i europeiska talformat.

Ett problem med tabbavgränsat format är att tabbstopp ofta betraktas som blanksteg i ostrukturerad text. IANA-standarden för TSV främjar dock ren och korrekt parsning av TSV-filer genom att inte tillåta flikar i fält.

Observera följande krav för TSV-filer i Machine Learning Studio (klassisk):

  • Modulen Konvertera till TSV stöder utdata från en enda rubrikrad om datauppsättningen innehåller kolumnnamn.

  • TSV-providern stöder endast UTF-8-teckenskodning.

  • När du läser från eller skriver till TSV-filer kan prestandan vara långsammare än med andra format (till exempel CSV).

Förväntade indata

Namn Typ Description
Datamängd Datatabell Indatauppsättning

Utdata

Namn Typ Description
Resultatdatauppsättning GenericTsv Utdatauppsättning

Se även

Konverteringar av dataformat
A-Z-modullista