Exportar Dados
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
grava um conjunto de dados em várias formas de armazenamento baseado em nuvem no Azure, como tabelas, blobs e SQL do Azure
Categoria: entrada e saída de dados
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
este artigo descreve como usar o módulo exportar dados no Machine Learning Studio (clássico), para salvar resultados, dados intermediários e trabalhar com dados de seus experimentos em destinos de armazenamento em nuvem fora do Machine Learning Studio (clássico).
Este módulo dá suporte à exportação ou salvamento de dados para os seguintes serviços de dados de nuvem:
Exportar para consulta de Hive: gravar dados em uma tabela do hive em um cluster Hadoop do HDInsight.
exportar para Banco de Dados SQL do Azure: salvar dados em Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse.
Exportar para a tabela do Azure: salvar dados no serviço de armazenamento de tabela no Azure. O armazenamento de tabela é bom para armazenar grandes quantidades de dados. Ele fornece um formato de tabela escalonável, barato e altamente disponível.
exportar para Armazenamento de Blobs do Azure: salva dados no serviço Blob no Azure. Essa opção é útil para imagens, textos não estruturados ou dados binários. Dados no serviço de Blob podem ser compartilhados publicamente ou salvos em repositórios de dados de aplicativo protegidos.
Observação
O módulo exportar dados não oferece suporte à conexão com a conta de armazenamento de BLOBs do Azure se a opção "transferência segura necessária" estiver habilitada.
Tarefas relacionadas
Baixar dados: para baixar seus dados para que você possa abri-los no Excel ou em outro aplicativo, use um módulo como converter para CSV ou converter em TSV para preparar os dados em um formato específico e, em seguida, baixar os dados.
Você pode baixar os resultados de qualquer módulo que produza um conjunto de um clique com o botão direito do mouse na saída e selecionando baixar conjuntode resultados. Por padrão, os dados são exportados no formato CSV.
Baixe uma definição de módulo ou grafo de experimento: Uma nova biblioteca do PowerShell permite baixar os metadados completos para seu experimento ou os detalhes de um módulo específico. o PowerShell para Machine Learning library é uma versão experimental, mas tem muitos cmdlets úteis:
Get-AmlExperiment
lista todos os experimentos em um espaço de trabalho.Export-AmlExperimentGraph
exporta uma definição do experimento completo para um arquivo JSON.Download-AmlExperimentNodeOutput
permite extrair as informações fornecidas nas portas de saída de qualquer módulo.
Como configurar o módulo Exportar Dados
Adicione o módulo exportar dados ao seu experimento no Studio (clássico). Você pode encontrar esse módulo na categoria Entrada e Saída.
Conexão exportar dados para o módulo que contêm os dados que você deseja exportar.
Clique duas vezes em exportar dados para abrir o painel Propriedades .
Para destino de dados, selecione o tipo de armazenamento em nuvem onde você salvará os dados. Se você fizer alterações nessa opção, todas as outras propriedades serão redefinidas. Portanto, escolha esta opção primeiro!
Forneça um nome de conta e um método de autenticação necessários para acessar a conta de armazenamento especificada.
Dependendo do tipo de armazenamento e se a conta estiver protegida, talvez seja necessário fornecer o nome da conta, o tipo de arquivo, a chave de acesso ou o nome do contêiner. Para fontes que não exigem autenticação, geralmente é suficiente saber a URL.
Para obter exemplos de cada tipo, consulte os seguintes tópicos:
A opção usar resultados armazenados em cachepermite repetir o experimento sem reescrever os mesmos resultados a cada vez.
Se você desmarcar essa opção, os resultados serão gravados no armazenamento toda vez que o experimento for executado, independentemente de os dados de saída terem sido alterados.
Se você selecionar essa opção, exportar dados usará os dados armazenados em cache, se disponíveis. Novos resultados são gerados somente quando há uma alteração upstream que afetaria os resultados.
Execute o experimento.
Exemplos
Para obter exemplos de como usar o módulo exportar dados , consulte a Galeria de ia do Azure:
Classificação de texto: Este exemplo usa exportar dados para salvar resultados intermediários e, em seguida, usa importar dados para obtê-los do armazenamento para etapas posteriores no experimento.
previsão de varejo etapa 1 de 6-pré-processamento de dados: o modelo de previsão de varejo ilustra uma tarefa de aprendizado de máquina baseada em dados armazenados no Banco de Dados SQL do Azure. ele demonstra várias técnicas úteis, como a criação de um banco de dados SQL do Azure para aprendizado de máquina, usando o banco de dados SQL do Azure para passar datasets entre experimentos em contas diferentes, salvando e combinando previsões.
criar e implantar um modelo de aprendizado de máquina usando SQL Server em uma vm do azure: este artigo demonstra como você pode usar um banco de dados SQL Server hospedado em uma vm do azure como uma fonte para armazenar dados de treinamento e as previsões geradas pelo experimento. Ele também ilustra como o banco de dados relacional pode ser usado para engenharia de recursos e seleção de recursos.
como usar o Azure ML com SQL do Azure Data Warehouse: este artigo mostra como você pode criar um modelo de aprendizado de máquina usando dados no SQL do Azure Data Warehouse.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
Detalhes de implementação
Esse módulo era denominado Writeranteriormente. Se você tiver um experimento existente que usa o módulo gravador , o módulo será renomeado para exportar dados quando você atualizar o experimento.
Nem todos os módulos produzem saída que é compatível com os destinos de dados de exportação . Por exemplo, Export data não pode salvar um conjunto de dados que foi convertido para o formato SVMLight. Os dados de exportação dão suporte a estes formatos:
- Dataset (formato interno do Azure ML)
- DataTable .NET
- CSV com ou sem cabeçalhos
- TSV com ou sem cabeçalhos
Problemas conhecidos
Quando você seleciona tabela do Azure como o local para gerar seus dados, ocasionalmente pode haver um erro ao gravar na tabela especificada. Quando isso acontece, os dados podem ser gravados em um blob.
Se esse erro ocorrer e posteriormente você não conseguir ler a partir da tabela esperada, tente usar um utilitário de armazenamento do Azure para verificar os BLOBs no contêiner especificado em sua conta de armazenamento.
No momento, não é possível salvar um blob em uma tabela do hive especificada. Se você precisar escrever resultados intermediários, evite usar uma tabela do hive no HDInsight e use o armazenamento de BLOBs ou o armazenamento de tabelas em vez disso.
Atualmente, se você selecionar HDFS como o local para salvar os dados de saída, essa mensagem de erro será retornada: "Microsoft. Analytics. Exceptions. ErrorMapping + Moduleexception".
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Dataset | Tabela de Dados | O conjunto de dados a ser gravado. |
Parâmetros do módulo
Esta tabela lista os parâmetros que se aplicam a todas as opções de exportação de dados . Outros parâmetros são dinâmicos e mudam dependendo do destino de dados selecionado.
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Especifique o destino dos dados | Lista | DataSourceOrSink | Serviço blob no Armazenamento do Azure | indique se o destino de dados é um arquivo no serviço Blob, um arquivo no serviço tabela, um banco de SQL no Azure ou uma tabela Hive. |
Usar resultados em cache | TRUE/FALSE | Boolean | FALSE | Selecione esta opção para evitar reescrever os resultados desnecessariamente. Se algo mudar de fluxo no experimento, os dados de exportação sempre serão executados e gravarão novos resultados. No entanto, se nada tiver sido alterado e você tiver selecionado essa opção, os dados de exportação não serão executados para evitar a regravação dos mesmos resultados. |
Exceções
Exceção | Descrição |
---|---|
Erro 0057 | Ocorrerá uma exceção ao tentar criar um arquivo ou um blob que já existe. |
Erro 0001 | Ocorre uma exceção se uma ou mais colunas especificadas do conjunto de dados não podem ser encontradas. |
Erro 0027 | Ocorrerá uma exceção quando dois objetos precisam ser do mesmo tamanho, mas eles não são. |
Erro 0079 | Ocorrerá uma exceção se o nome do contêiner no Armazenamento do Azure for especificado incorretamente. |
Erro 0052 | Ocorrerá uma exceção se a chave de acesso de armazenamento para a conta do Azure for especificada incorretamente. |
Erro 0064 | Ocorrerá uma exceção se a chave de acesso de armazenamento ou o nome de conta para a conta do Azure for especificada incorretamente. |
Erro 0071 | Ocorrerá uma exceção se as credenciais fornecidas estiverem incorretas. |
Erro 0018 | Ocorrerá uma exceção se o conjunto de dados de entrada não é válido. |
Erro 0029 | Ocorrerá uma exceção quando um URI inválido for passado. |
Erro 0003 | Ocorrerá uma exceção se uma ou mais entradas forem nulas ou estiverem vazias. |
para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.
para obter uma lista de exceções de api, consulte Machine Learning códigos de erro da api REST.
Confira também
Importar dados
Entrada e saída de dados
Transformação de dados
Comparando o Armazenamento de Tabela do Azure e o Banco de Dados SQL do Azure
Lista de Módulo A-Z