Datenerfassungstools für die Data Science-VM
In einer frühen Phase eines Data Science- oder KI-Projekts müssen Sie die erforderlichen Datasets identifizieren und diese in Ihre Analyseumgebung importieren. Die Data Science Virtual Machine (DSVM) stellt Tools und Bibliotheken bereit, um Daten aus verschiedenen Quellen in lokale analytische Datenspeicherressourcen auf der DSVM zu importieren. Die DSVM kann auch Daten in eine Datenplattform importieren, die sich entweder in der Cloud befindet oder lokal ist.
Die DSVM bietet diese Datenbewegungstools:
Azure CLI
Category | Wert |
---|---|
Was ist das? | Ein Verwaltungstool für Azure. Es bietet Befehlsverben zum Verschieben von Daten von Azure-Datenplattformen – z. B. Azure Blob-Speicher und Azure Data Lake Store |
Unterstützte DSVM-Versionen | Windows, Linux |
Typische Verwendung | Importieren und Exportieren von Daten zwischen Azure Storage und Azure Data Lake Store |
Verwendung/Ausführung | Öffnen Sie eine Eingabeaufforderung, und geben Sie az ein, um Hilfe zu erhalten. |
Links zu Beispielen | Verwenden der Azure-Befehlszeilenschnittstelle |
AzCopy
Category | Wert |
---|---|
Was ist das? | Ein Tool zum Kopieren von Daten zwischen lokalen Dateien, Azure-Blobspeichern, -dateien und -tabellen |
Unterstützte DSVM-Versionen | Windows |
Typische Verwendung | Kopieren von Dateien in den Azure Blob-Speicher Kopieren von Blobs zwischen Konten |
Verwendung/Ausführung | Öffnen Sie eine Eingabeaufforderung, und geben Sie azcopy ein, um Hilfe zu erhalten. |
Links zu Beispielen | AzCopy unter Windows |
Azure Cosmos DB-Datenmigrationstool
Kategorie | Wert |
---|---|
Was ist das? | Tool, mit dem Daten aus verschiedenen Quellen in Azure Cosmos DB importiert werden können, eine NoSQL-Datenbank in der Cloud. Diese Quellen umfassen JSON-Dateien CSV-Dateien SQL MongoDB Azure Table Storage Amazon DynamoDB Azure Cosmos DB for NoSQL-Sammlungen |
Unterstützte DSVM-Versionen | Windows |
Typische Verwendung | Importieren von Dateien von einem virtuellen Computer in Azure Cosmos DB Importieren von Daten aus einem Azure-Tabellenspeicher in Azure Cosmos DB Importieren von Daten aus einer Microsoft SQL Server-Datenbank in Azure Cosmos DB |
Verwendung/Ausführung | Öffnen Sie zum Verwenden der Befehlszeilenversion eine Eingabeaufforderung, und geben Sie dt ein. Öffnen Sie zum Verwenden des GUI-Tools eine Eingabeaufforderung, und geben Sie dtui ein |
Links zu Beispielen | Import data into Azure Cosmos DB (Importieren von Daten in Azure Cosmos DB) |
Azure Storage-Explorer
Category | Wert |
---|---|
Was ist das? | Grafische Benutzeroberfläche für die Interaktion mit Dateien, die in der Azure-Cloud gespeichert sind |
Unterstützte DSVM-Versionen | Windows |
Typische Verwendung | Importieren von Daten in die und Exportieren von Daten aus der DSVM |
Verwendung/Ausführung | Suchen nach „Azure Storage-Explorer“ im Startmenü |
Links zu Beispielen | Azure Storage-Explorer |
bcp
Category | Wert |
---|---|
Was ist das? | SQL Server-Tool zum Kopieren von Daten zwischen SQL Server und einer Datendatei |
Unterstützte DSVM-Versionen | Windows |
Typische Verwendung | Importieren einer CSV-Datei in eine SQL Server-Tabelle Exportieren einer SQL Server-Tabelle in eine Datei |
Verwendung/Ausführung | Öffnen Sie eine Eingabeaufforderung, und geben Sie bcp ein, um Hilfe zu erhalten |
Links zu Beispielen | bcp-Hilfsprogramm |
blobfuse
Category | Wert |
---|---|
Was ist das? | Ein Tool zum Einbinden eines Azure Blob-Speichercontainers in das Linux-Dateisystem |
Unterstützte DSVM-Versionen | Linux |
Typische Verwendung | Lesen aus einem und Schreiben in Blobs in einen Container |
Verwenden und Ausführen | Ausführen von blobfuse auf einem Terminal |
Links zu Beispielen | blobfuse auf GitHub |