Convert to TSV
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Converte l'input di dati in un formato con valori delimitati da tabulazioni
Categoria: Conversioni del formato dati
Nota
Si applica a: Machine Learning Studio (versione classica)
Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Converti in TSV in Machine Learning Studio (versione classica) per convertire qualsiasi set di dati dal formato interno usato da tutti i moduli di Machine Learning Studio (versione classica) in un file flat in formato delimitato da tabulazioni.
I file con valori delimitati da tabulazioni (TSV) sono compatibili con molti strumenti esterni, ad esempio:
R e Python
Excel e PowerPivot
Tutti i database relazionali
Ad esempio, se l'esperimento ha un set di dati intermedio che si vuole salvare per il nuovo uso in un altro strumento o che si vuole chiamare dal codice, convertirlo nel formato TSV e quindi fare clic con il pulsante destro del mouse sul set di dati convertito per ottenere il codice Python necessario per accedere al set di dati.
Come usare Convert to TSV (Converti in TSV)
Usare il modulo Converti in TSV ogni volta che è necessario scaricare un set di dati in formato delimitato da tabulazioni.
Aggiungere la conversione in TSV all'esperimento. È possibile trovare questo modulo nella categoria Conversioni formato dati in Machine Learning Studio (versione classica).
Connessione il modulo a un altro datset o a un modulo che restituisce un set di dati tabulare.
Eseguire l'esperimento oppure fare clic con il pulsante destro del mouse sul modulo Convert to TSV (Converti in TSV ) e scegliere Run selected (Esegui selezionato).
Risultati
Al termine della conversione, è possibile aprire il set di dati, chiamarlo dal codice R o Python, usarlo in un notebook di Jupyter o salvarlo in un file locale.
Se si vuole scaricare il set di dati, fare doppio clic sull'output del modulo e indicare se si vuole aprire o salvare il datset.
Se si seleziona Apri, il set di dati viene caricato usando qualsiasi strumento utilizzato dal computer per impostazione predefinita per aprire . File TSV. In genere si tratta Microsoft Excel.
Se si seleziona Scarica set di dati, per impostazione predefinita il file viene salvato con il nome del modulo e un GUID che rappresenta l'ID dell'area di lavoro. Tuttavia, è possibile selezionare l'opzione Salva con nome durante il download e modificare il nome o il percorso del file.
Esempio
Anche se non esistono esempi specifici di questo formato, è possibile vedere esempi di come viene usata la conversione del formato esplorando questi esperimenti di esempio nel Azure AI Gallery:
Esempio di convalida incrociata per la classificazione binaria: esporta i risultati della convalida incrociata nel formato CSV (Comma-Separated Value) in modo che i risultati per più modelli possano essere confrontati usando uno strumento come Excel.
Quantizzazione della compressione delle immagini basata sul colore: esporta i set di dati usati per ogni parte dell'analisi in file CSV, in modo da poter eseguire facilmente un modello simile in qualsiasi strumento che supporta il formato CSV.
Note tecniche
Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.
Requisiti di formato TSV
Il formato con valori delimitati da tabulazioni (TSV) è un formato di testo usato per archiviare i dati in una struttura tabulare. È molto simile al formato CSV, ma il delimitatore è una tabulazione anziché una virgola.
Il formato TSV è un'utile alternativa al formato CSV se i dati contengono virgole. Le virgole sono molto comuni nei dati di testo e vengono usate nei formati di numero europei.
Un problema con il formato con valori delimitati da tabulazioni è che spesso le tabulazioni sono considerate come spazi vuoti in testo non strutturato. Secondo lo standard IANA per TSV però viene favorita un'analisi chiara e accurata dei file TSV disabilitando le tabulazioni all'interno dei campi.
Tenere presenti i requisiti seguenti per i file TSV in Machine Learning Studio (versione classica):
Il modulo Convert to TSV supporta l'output di una singola riga di intestazione se il set di dati contiene nomi di colonna.
Il provider TSV supporta solo la codifica dei caratteri UTF-8.
Durante la lettura o la scrittura di file TSV, è possibile che le prestazioni risultino ridotte rispetto ad altri formati, ad esempio CSV.
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Set di dati | Tabella dati | Set di dati di input |
Output
Nome | Tipo | Descrizione |
---|---|---|
Set di dati di risultati | GenericTsv | Set di dati di output |