Ferramentas de ingestão de dados de Máquina Virtual de Ciência de Dados
Em um estágio inicial de um projeto de ciência de dados ou IA, você deve identificar os conjuntos de dados necessários e, em seguida, trazê-los para o seu ambiente de análise. A Máquina Virtual de Ciência de Dados (DSVM) fornece ferramentas e bibliotecas para trazer dados de diferentes fontes para recursos de armazenamento de dados analíticos locais na DSVM. A DSVM também pode trazer dados para uma plataforma de dados localizada na nuvem ou no local.
A DSVM oferece essas ferramentas de movimentação de dados:
CLI do Azure
Categoria | Valor |
---|---|
O que é? | Uma ferramenta de gerenciamento para o Azure. Oferece verbos de comando para mover dados de plataformas de dados do Azure, por exemplo, o Armazenamento de Blobs do Azure e o Azure Data Lake Store |
Versões da DSVM com suporte | Windows, Linux |
Usos típicos | Importar e exportar dados entre o Armazenamento do Microsoft Azure e o Azure Data Lake Store |
Como usar/executar? | Abra um prompt de comando e digite az para obter ajuda. |
Links para exemplos | Usando a CLI do Azure |
AzCopy
Categoria | Valor |
---|---|
O que é? | Uma ferramenta para copiar dados entre arquivos locais, Armazenamento de Blobs do Azure, arquivos e tabelas |
Versões da DSVM com suporte | Windows |
Usos típicos | Copiar arquivos para o Armazenamento de Blobs do Azure Copiar blobs entre contas |
Como usar/executar? | Abra um prompt de comando e digite azcopy para obter ajuda. |
Links para exemplos | AzCopy no Windows |
Ferramenta de migração de dados do Azure Cosmos DB
Categoria | Valor |
---|---|
O que é? | Ferramenta para importar dados de várias fontes para o Azure Cosmos DB, um banco de dado do NoSQL na nuvem. Essas fontes incluem arquivos JSON Arquivos CSV SQL MongoDB Armazenamento de Tabelas do Azure Amazon DynamoDB Coleções do Azure Cosmos DB for NoSQL |
Versões da DSVM com suporte | Windows |
Usos típicos | Importar arquivos de uma VM para o Microsoft Azure Cosmos DB importar dados do armazenamento de tabelas do Azure para o Microsoft Azure Cosmos DB importar dados de um banco de dados do Microsoft SQL Server para o Azure Cosmos DB |
Como usar/executar? | Para usar a versão de linha de comando, abra um prompt de comando e digite dt . Para usar a ferramenta GUI, abra um prompt de comando e digite dtui |
Links para exemplos | Importar dados no Azure Cosmos DB |
Gerenciador de Armazenamento do Azure
Categoria | Valor |
---|---|
O que é? | Interface Gráfica do Usuário para interagir com arquivos armazenados na nuvem do Azure |
Versões da DSVM com suporte | Windows |
Usos típicos | Importar dados para e exportar dados da DSVM |
Como usar/executar? | Procure pelo "Gerenciador de Armazenamento do Microsoft Azure" no menu Iniciar |
Links para exemplos | Gerenciador de Armazenamento do Azure |
bcp
Categoria | Valor |
---|---|
O que é? | Ferramenta do SQL Server para copiar dados entre o SQL Server e um arquivo de dados |
Versões da DSVM com suporte | Windows |
Usos típicos | Importar um arquivo CSV para uma tabela do SQL Server Exportar uma tabela do SQL Server para um arquivo |
Como usar/executar? | Abra um prompt de comando e digite bcp para obter ajuda |
Links para exemplos | utilitário bcp |
blobfuse
Categoria | Valor |
---|---|
O que é? | Uma ferramenta para montar um contêiner de Armazenamento de Blobs do Azure no sistema de arquivos do Linux |
Versões da DSVM com suporte | Linux |
Usos típicos | Leitura e gravação em blobs em um contêiner |
Como usá-lo e executá-lo? | Execute o blobfuse em um terminal |
Links para exemplos | blobfuse no GitHub |