Freigeben über


Convert to TSV

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Konvertiert die Dateneingabe in ein Format mit Tabstopptrennzeichen

Kategorie: Datenformatkonvertierungen

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Convert to TSV in Machine Learning Studio (classic) verwenden, um jedes Dataset aus dem internen Format, das von allen Machine Learning Studio(classic)-Modulen verwendet wird, in eine Flatdatei im tabstopptrennten Format zu konvertieren.

Tabstoppgetrennte Dateien (TSV, Tab-separated value) sind kompatibel mit vielen externen Tools, einschließlich:

  • R und Python

  • Excel und PowerPivot

  • Alle relationalen Datenbanken

Wenn Ihr Experiment z. B. über ein Zwischen-Dataset verfügt, das Sie zur erneuten Verwendung in einem anderen Tool speichern oder aus code aufrufen möchten, konvertieren Sie es in das TSV-Format und klicken dann mit der rechten Maustaste auf das konvertierte Dataset, um den Python-Code zu erhalten, der für den Zugriff auf das Dataset erforderlich ist.

Verwenden von Convert to TSV

Verwenden Sie das Modul Convert to TSV , wenn Sie ein Dataset im Durch Tabstopp getrennten Format herunterladen müssen.

  1. Fügen Sie ihrem Experiment convert to TSV (In TSV konvertieren) hinzu. Sie finden dieses Modul in der Kategorie Datenformatkonvertierungen in Machine Learning Studio (klassisch).

  2. Verbinden Modul in ein anderes Datset oder in ein Modul, das ein tabellarisches Dataset aus gibt.

  3. Führen Sie das Experiment aus, oder klicken Sie mit der rechten Maustaste auf das Modul Convert to TSV (In TSV konvertieren), und wählen Sie Ausgewählte ausführen aus.

Ergebnisse

Wenn die Konvertierung abgeschlossen ist, können Sie das Dataset öffnen, über R- oder Python-Code aufrufen, es in einem Jupyter Notebook verwenden oder es in einer lokalen Datei speichern.

Wenn Sie das Dataset herunterladen möchten, doppelklicken Sie auf die Modulausgabe, und geben Sie an, ob Sie das Datset öffnen oder speichern möchten.

  • Wenn Sie Öffnen auswählen, wird das Dataset mit dem Tool geladen, das Ihr Computer standardmäßig zum Öffnen von verwendet. TSV-Dateien. In der Regel ist dies Microsoft Excel.

  • Wenn Sie Dataset herunterladen auswählen, wird die Datei standardmäßig mit dem Namen des Moduls und einer GUID gespeichert, die die Arbeitsbereichs-ID darstellt. Sie können jedoch während des Downloads die Option Speichern unter auswählen und den Dateinamen oder Speicherort ändern.

Beispiele

Obwohl es keine Beispiele gibt, die für dieses Format spezifisch sind, können Sie Beispiele für die Verwendung der Formatkonvertierung sehen, indem Sie diese Beispielexperimente im folgenden Azure KI-Katalog:

  • Beispiel für Kreuzvalidierung für binäre Klassifizierung: Exportiert die Ergebnisse der Kreuzvalidierung in das CSV-Format (Comma-Separated Value), sodass die Ergebnisse für mehrere Modelle mithilfe eines Tools wie Excel.

  • Farbbasierte Bildkomprimierungsquantisierung: Exportiert die Datasets, die für jeden Teil der Analyse verwendet werden, in CSV-Dateien, sodass Sie problemlos ein ähnliches Modell in jedem Tool ausführen können, das das CSV-Format unterstützt.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

TSV-Formatanforderungen

Tabstoppgetrennte Werte (TSV) ist ein Textformat, das zum Speichern von Daten im Tabellenformat verwendet wird. Es ähnelt sehr dem CSV-Format, nur dass ein Tabstopp anstelle eines Kommas als Trennzeichen verwendet wird.

Das TSV-Format ist eine nützliche Alternative zum CSV-Format, wenn die Daten bereits Kommas enthalten. Kommas werden häufig in Textdaten und im europäischen Zahlenformat verwendet.

Ein Problem bei dem Format mit Tabstopptrennzeichen besteht darin, dass Tabstopps in unstrukturiertem Text oftmals als Leerzeichen betrachtet werden. Der IANA-Standard für TSV sorgt allerdings für eine saubere und genaue Analyse von TSV-Dateien, indem er Tabstopps innerhalb von Feldern untersagt.

Beachten Sie die folgenden Anforderungen für TSV-Dateien in Machine Learning Studio (klassisch):

  • Das Modul Convert to TSV unterstützt die Ausgabe einer einzelnen Überschriftenzeile, wenn das Dataset Spaltennamen enthält.

  • Der TSV-Anbieter unterstützt nur die UTF-8-Zeichenkodierung.

  • Beim Lesen und Schreiben von TSV-Dateien kann die Leistung langsamer als bei anderen Formaten (z. B. CSV) sein.

Erwartete Eingaben

Name Type Beschreibung
Dataset Datentabelle Eingabedataset

Output

Name Type Beschreibung
Ergebnisdataset GenericTsv Ausgabedataset

Siehe auch

Datenformatkonvertierungen
Modulliste von A bis Z