Exportieren in Azure Blob Storage
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
In diesem Artikel wird beschrieben, wie Sie die Option In Azure Blob Storage exportieren im Modul Daten exportieren in Machine Learning Studio (klassisch) verwenden.
Hinweis
Gilt für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Diese Option ist nützlich, wenn Sie Daten aus einem Machine Learning-Experiment in ein Azure Blob Storage. Beispielsweise können Sie Machine Learning-Datenausgabe für andere Anwendungen freigeben oder Zwischendaten oder bereinigte Datasets für die Verwendung in anderen Experimenten speichern.
Azure-Blobs können von überall aus über HTTP oder HTTPS aufgerufen werden. Da Azure Blob Storage ein unstrukturierter Datenspeicher ist, können Sie Daten in verschiedenen Formaten exportieren. Derzeit werden die Formate CSV, TSV und ARFF unterstützt.
Um Daten zur Verwendung durch andere Anwendungen in ein Azure-Blob zu exportieren, verwenden Sie das Modul Daten exportieren, um die Daten in Azure Blob Storage. Verwenden Sie dann ein beliebiges Tool, das Daten aus Azure Storage lesen kann (z. B. Excel, Cloudspeicherprogramme oder andere Clouddienste), um die Daten zu laden und zu verwenden.
Hinweis
Die Module Daten importierenund Daten exportieren können Daten nur aus Azure Storage lesen und schreiben, der mit dem klassischen Bereitstellungsmodell erstellt wurde. Anders ausgedrückt: Der neue Azure Blob Storage-Kontotyp, der die Speicherzugriffsebenen "Heiß" und "Kalt" bietet, wird noch nicht unterstützt.
Im Allgemeinen sollten Azure-Speicherkonten, die Sie ggf. erstellt haben, bevor diese Dienstoption verfügbar war, nicht betroffen sein.
Wenn Sie jedoch ein neues Konto für die Verwendung mit Machine Learning erstellen müssen, empfiehlt es sich, entweder klassisch als Bereitstellungsmodell auszuwählen oderResource Manager zu verwenden und als Kontoart die Option Allgemein anstelle von Blob Storage auszuwählen.
Exportieren von Daten in Azure Blob Storage
Der Blob-Dienst in Azure dient zum Speichern großer Datenmengen, einschließlich binärer Daten. Es gibt zwei Blob-Speichertypen: öffentliche Blobs und Blobs, die Anmeldeinformationen erfordern.
Fügen Sie Ihrem Experiment das Modul Export Data hinzu. Sie finden dieses Modul in studio ( klassisch) in der Kategorie Dateneingabe und -ausgabe.
Verbinden Sie Daten in das Modul exportieren, das die Daten erzeugt, die Sie in die Azure Blob Storage.
Öffnen Sie den Bereich Eigenschaften von Daten exportieren. Wählen Sie für das Datenziel Azure Blob Storage.
Wählen Sie unter Authentifizierungstyp die Option Öffentlich (SAS-URL) aus, wenn Sie wissen, dass der Speicher den Zugriff über eine SAS-URL unterstützt.
Eine SAS-URL ist ein spezieller URL-Typ, der mithilfe eines Azure Storage-Hilfsprogramms generiert werden kann und nur für einen begrenzten Zeitraum verfügbar ist. Die URL enthält alle Informationen, die für die Authentifizierung und für Downloads erforderlich sind.
Unter URI geben oder fügen Sie den vollständigen URI ein, der das Konto und den öffentlichen Blob definiert.
Wählen Sie für private Konten Account (Konto) aus, und geben Sie den Kontonamen und Kontoschlüssel an, damit das Experiment Schreibzugriff auf das Speicherkonto erhält.
Kontoname: Geben Oder fügen Sie den Namen des Kontos ein, unter dem Sie die Daten speichern möchten. Wenn die vollständige URL des Speicherkontos z.B.
https://myshared.blob.core.windows.net
lautet, geben Siemyshared
ein.Kontoschlüssel: Fügen Sie den Speicherzugriffsschlüssel ein, der dem Konto zugeordnet ist.
Pfad zu Container, Verzeichnis oder Blob: Geben Sie den Namen des Blobs ein, in dem die exportierten Daten gespeichert werden. Wenn Sie die Ergebnisse Ihres Experiments in einem neuen Blob namens results01.csv im Container predictions unter einem Konto namens mymldata speichern möchten, lautet die vollständige URL des Blobs:
https://mymldata.blob.core.windows.net/predictions/results01.csv
.Daher würden Sie im Feld Pfad zum Container, Verzeichnis oder Blob den Container- und Blobnamen wie folgt angeben:
predictions/results01.csv
Wenn Sie den Namen eines Blobs angeben, der noch nicht vorhanden ist, wird der Blob in Azure für Sie erstellt.
Beim Schreiben in ein vorhandenes Blob können Sie angeben, dass der aktuelle Inhalt des Blobs überschrieben werden soll, indem Sie die -Eigenschaft festlegen, Azure Blob Storage Schreibmodus festlegen. Diese Eigenschaft wird standardmäßig auf Error (Fehler) festgelegt. Das bedeutet, dass ein Fehler gemeldet wird, sobald eine bestehende Blob-Datei mit demselben Namen gefunden wird.
Wählen Sie für File format for blob file (Dateiformat für Blob-Datei) das Format aus, in dem die Daten gespeichert werden sollen.
CSV: Durch Komma getrennte Werte (CSV) ist das Standardspeicherformat. Um Spaltenüberschriften zusammen mit den Daten zu exportieren, wählen Sie die Option Write blob header row (Blob-Kopfzeile schreiben) aus. Weitere Informationen zum durch Trennzeichen getrennten Format, das in der Machine Learning verwendet wird, finden Sie unter Konvertieren in CSV.
TSV: Das TSV-Format (Tab-Separated Values) ist mit vielen Machine Learning-Tools kompatibel. Um Spaltenüberschriften zusammen mit den Daten zu exportieren, wählen Sie die Option Write blob header row (Blob-Kopfzeile schreiben) aus. Weitere Informationen zum formatierten Format mit Tabstopps, das in Machine Learning verwendet wird, finden Sie unter Konvertieren in TSV.
ARFF: Dieses Format unterstützt das Speichern von Dateien im vom Weka-Toolset verwendeten Format. Dieses Format wird für Dateien, die in einer SAS-URL gespeichert sind, nicht unterstützt. Weitere Informationen zum ARFF-Format finden Sie unter Konvertieren in ARFF.
Zwischengespeicherte Ergebnisse verwenden: Wählen Sie diese Option aus, wenn Sie vermeiden möchten, dass die Ergebnisse bei jeder Ausführung des Experiments erneut in die Blobdatei geschrieben werden. Sofern es keine weiteren Änderungen an den Modulparametern gibt, werden die Ergebnisse vom Experiment in zwei Fällen in die Datei geschrieben: bei der ersten Ausführung des Moduls oder wenn sich Daten ändern.
Beispiele
Beispiele für die Verwendung des Moduls "Export Data " finden Sie im Azure KI-Katalog:
Convert Dataset to VW Format (Dataset in VW-Format konvertieren): In diesem Experiment wird das Python-Skript zusammen mit dem Modul Export Data verwendet, um Daten zu erstellen, die von Vowpal Wabbit verwendet werden können.
Einrichten von Predictive Analytics-Pipelines mit Azure SQL Data Warehouse: In diesem Szenario wird die Datenbewegung zwischen mehreren Komponenten beschrieben, einschließlich Machine Learning und SQL Data Warehouse.
Batchbewertung ohne Code: In diesem Tutorial wird veranschaulicht, wie Sie Azure Logic Apps verwenden können, um sowohl den Import von Daten zu automatisieren, die von Experimenten verwendet werden, als auch das Schreiben von Experimentergebnissen in Blob Storage.
Operationalisieren einer Azure ML-Lösung mit lokalem SQL Server mithilfe von Azure Data Factory: In diesem Artikel wird eine komplexere Datenpipeline beschrieben, die Daten zurück an eine lokale SQL Server-Datenbank sendet und blob storage als Zwischenphase verwendet. Die Verwendung einer lokalen Datenbank erfordert die Konfiguration eines Datengateways. Sie können diesen Teil des Beispiels jedoch überspringen und nur Blob Storage verwenden.
Technische Hinweise
Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.
Häufig gestellte Fragen
Wie kann ich das Schreiben der Daten vermeiden, wenn sich das Experiment nicht geändert hat?
Wenn sich die Ergebnisse Ihres Experiments ändern, speichert Export Data immer das neue Dataset. Wenn Sie das Experiment jedoch wiederholt ausführen, ohne Änderungen vorzunehmen, die sich auf die Ausgabedaten auswirken, können Sie die Option Zwischengespeicherte Ergebnisse verwenden auswählen.
Das Modul überprüft, ob das Experiment zuvor mit den gleichen Daten und den gleichen Optionen ausgeführt wurde. Wenn eine vorherige Ausführung gefunden wird, wird der Schreibvorgang nicht wiederholt.
Kann ich Daten in einem Konto in einer anderen geografischen Region speichern?
Ja, Sie können Daten in Konten in verschiedenen Regionen schreiben. Wenn sich das Speicherkonto jedoch in einer anderen Region befindet als der Computeknoten, der für das Machine Learning-Experiment verwendet wird, kann der Datenzugriff langsamer sein. Außerdem werden Ihnen für den Ein- und Ausgangsdatendaten für das Abonnement Gebühren berechnet.
Modulparameter
Allgemeine Optionen
Name | Range | type | Standard | Beschreibung |
---|---|---|---|---|
Datenquellen- | Liste | Datenquelle oder Senke | Azure Blob Storage | Das Ziel kann eine Datei in Azure BLOB Storage, eine Azure-Tabelle, eine Tabelle oder Sicht in einem Azure SQL-Datenbank oder eine Hive-Tabelle sein. |
Zwischengespeicherte Ergebnisse verwenden | TRUE/FALSE | Boolean | FALSE | Das Modul wird nur ausgeführt, wenn kein gültiger Cache vorhanden ist. verwenden andernfalls zwischengespeicherte Daten aus der vorherigen Ausführung. |
Please specify authentication type | SAS/Konto | AuthenticationType | Konto | Gibt an, ob SAS- oder Kontoanmeldeinformationen für die Zugriffsautorisierung verwendet werden sollen. |
Öffentlich oder SAS: Optionen für öffentlichen Speicher
Name | Range | type | Standard | Beschreibung |
---|---|---|---|---|
SAS URI for blob | any | Zeichenfolge | Keine | Der SAS-URI des Blobs, in das geschrieben werden soll (erforderlich) |
File format for SAS file | ARFF CSV TSV |
LoaderUtils.FileTypes | CSV | Gibt an, ob die Datei CSV, TSV oder ARFF ist. (erforderlich) |
Write SAS header row | TRUE/FALSE | Boolean | FALSE | Gibt an, ob Spaltenüberschriften in die Datei geschrieben werden sollen. |
Konto – Optionen für privaten Speicher
Name | Range | type | Standard | Beschreibung |
---|---|---|---|---|
Azure account name | any | Zeichenfolge | Keine | Name des Azure-Benutzerkontos |
Azure account key | any | SecureString | Keine | Azure-Speicherschlüssel |
Path to blob beginning with container | any | Zeichenfolge | Keine | Name der Blobdatei, beginnend mit dem Containernamen |
Azure Blob Storage Schreibmodus | List: Error, Overwrite | enum:BlobFileWriteMode | Fehler | Auswählen der Methode zum Schreiben von Blobdateien |
File format for blob file | ARFF CSV TSV |
LoaderUtils.FileTypes | CSV | Gibt an, ob es sich bei der Blobdatei um EINE CSV-, TSV- oder ARFF-Datei handelt. |
Write blob header row | TRUE/FALSE | Boolean | FALSE | Gibt an, ob die Blobdatei über eine Headerzeile verfügen soll. |
Ausnahmen
Ausnahme | Beschreibung |
---|---|
Fehler 0027 | Eine Ausnahme tritt auf, wenn zwei Objekte gleich groß sein müssen, dies aber nicht der Fall ist. |
Fehler 0003 | Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist. |
Fehler 0029 | Eine Ausnahme tritt auf, wenn ein ungültiger URI übergeben wird. |
Fehler 0030 | Eine Ausnahme tritt auf, wenn es nicht möglich ist, eine Datei herunterzuladen. |
Fehler 0002 | Eine Ausnahme tritt auf, wenn mindestens ein Parameter nicht analysiert oder nicht aus einem angegebenen Typ in den für die Zielmethode erforderlichen Typ konvertiert werden konnte. |
Fehler 0009 | Eine Ausnahme tritt auf, wenn der Azure-Speicherkontoname oder der Containername falsch angegeben ist. |
Fehler 0048 | Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu öffnen. |
Fehler 0046 | Eine Ausnahme tritt auf, wenn es nicht möglich ist, ein Verzeichnis im angegebenen Pfad zu erstellen. |
Fehler 0049 | Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu analysieren. |
Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.
Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.
Siehe auch
Daten importieren
Daten exportieren
Exportieren nach Azure SQL-Datenbank
Exportieren nach Hive-Abfrage
Exportieren nach Azure Table