Partilhar via


Exportação para Azure Blob Armazenamento

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Este artigo descreve como utilizar a opção Export to Azure Blob Armazenamento, no módulo de Dados de Exportação em Machine Learning Studio (clássico).

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Esta opção é útil quando pretende exportar dados de uma experiência de machine learning para Azure Blob Armazenamento. Por exemplo, pode querer partilhar saídas de dados de machine learning com outras aplicações, ou armazenar dados intermédios ou conjuntos de dados limpos para utilização noutras experiências.

As bolhas Azure podem ser acedidas a partir de qualquer lugar, utilizando HTTP ou HTTPS. Como a Azure Blob Armazenamento é uma loja de dados não estruturada, pode exportar dados em vários formatos. Atualmente, os formatos CSV, TSV e ARFF são suportados.

Para exportar dados para a blob Azure para utilização por outras aplicações, utilize o módulo de Dados de Exportação para guardar os dados para a Azure Blob Armazenamento. Em seguida, utilize qualquer ferramenta que possa ler dados do armazenamento Azure (como Excel, utilitários de armazenamento em nuvem ou outros serviços de nuvem), para carregar e utilizar os dados.

Nota

Os módulos de Dados de Importação e Exportação só podem ler e escrever dados a partir do armazenamento Azure criados através do modelo de implementação Clássico. Por outras palavras, o novo tipo de conta Azure Blob Armazenamento que oferece níveis de acesso de armazenamento quentes e frescos ainda não está suportado.

Geralmente, quaisquer contas de armazenamento Azure que possa ter criado antes desta opção de serviço ficar disponível não devem ser afetadas.

No entanto, se precisar de criar uma nova conta para utilização com Machine Learning, recomendamos que selecione Classic para o modelo de Implementação, ou utilize o gestor de recursos e para o tipo conta, selecione o propósito geral em vez do armazenamento blob.

Como exportar dados para a Azure Blob Armazenamento

O serviço de blob Azure destina-se a armazenar grandes quantidades de dados, incluindo dados binários. Existem dois tipos de armazenamento de bolhas: bolhas públicas e bolhas que requerem credenciais de login.

  1. Adicione o módulo de Dados de Exportação à sua experiência. Pode encontrar este módulo na categoria entrada e saída de dados em Studio (clássico).

  2. Ligação Dados de Exportação para o módulo que produz os dados que pretende exportar para a Azure Blob Armazenamento.

  3. Abra o painel de propriedades dos dados de exportação. Para o destino de dados, selecione Azure Blob Armazenamento.

  4. Para o tipo de autenticação, escolha Público (URL SAS) se souber que o armazenamento suporta o acesso através de um URL SAS.

    Um URL SAS é um tipo especial de URL que pode ser gerado usando um utilitário de armazenamento Azure, e está disponível por apenas um tempo limitado. Contém toda a informação necessária para autenticação e download.

    Para URI, escreva ou cole o URI completo que define a conta e a bolha pública.

  5. Para contas privadas, escolha Conta e forneça o nome da conta e a chave da conta, para que a experiência possa escrever na conta de armazenamento.

    • Nome da conta: Digite ou cole o nome da conta onde pretende guardar os dados. Por exemplo, se o URL completo da conta de armazenamento for https://myshared.blob.core.windows.net, escreveria myshared.

    • Chave da conta: Cole a chave de acesso ao armazenamento que está associada à conta.

  6. Caminho para o contentor, diretório ou bolha: Digite o nome da bolha onde os dados exportados serão armazenados. Por exemplo, para guardar os resultados da sua experiência para uma nova bolha chamada results01.csv nas previsões do contentor numa conta chamada mymldata, o URL completo para a bolha seria https://mymldata.blob.core.windows.net/predictions/results01.csv.

    Portanto, no campo Caminho para o contentor, diretório ou bolha, você especificaria o recipiente e o nome blob da seguinte forma: predictions/results01.csv

  7. Se especificar o nome de uma bolha que já não existe, a Azure cria a bolha para si.

    Ao escrever para uma bolha existente, pode especificar que o conteúdo atual da bolha será substituído definindo a propriedade, Azure Blob Armazenamento modo de escrita. Por padrão, esta propriedade é definida como Error, o que significa que um erro é levantado sempre que um ficheiro blob existente com o mesmo nome é encontrado.

  8. Para o formato de ficheiro para ficheiro blob, selecione o formato em que os dados devem ser armazenados.

    • CSV: Valores separados por vírgula (CSV) é o formato de armazenamento padrão. Para exportar os títulos das colunas juntamente com os dados, selecione a opção, Escreva a linha do cabeçalho blob. Para obter mais informações sobre o formato delimitado em vírgula utilizado em Machine Learning, consulte Converter em CSV.

    • TSV: O formato de valores separados por separados por guias (TSV) é compatível com muitas ferramentas de aprendizagem automática. Para exportar os títulos das colunas juntamente com os dados, selecione a opção, Escreva a linha do cabeçalho blob. Para obter mais informações sobre o formato separado do separado por separados por Machine Learning separados, consulte Converter em TSV.

    • ESTE formato suporta a poupança de ficheiros no formato utilizado pelo toolset Weka. Este formato não é suportado para ficheiros armazenados num URL SAS. Para obter mais informações sobre o formato ARFF, consulte Converter em ARFF.

  9. Utilize resultados em cache: Selecione esta opção se quiser evitar reescrever os resultados no ficheiro blob sempre que executar a experiência. Se não houver outras alterações nos parâmetros do módulo, a experiência escreve os resultados apenas na primeira vez que o módulo é executado, ou quando há alterações nos dados.

Exemplos

Por exemplo, como utilizar o módulo de Dados de Exportação , consulte a Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Perguntas comuns

Como posso evitar escrever os dados se a experiência não mudou

Quando os resultados da sua experiência mudam, os Dados de Exportação guardam sempre o novo conjunto de dados. No entanto, se estiver a executar a experiência repetidamente sem fazer alterações que afetem os dados de saída, pode selecionar a opção de resultados em cache Utilização .

O módulo verifica se a experiência já foi executada anteriormente utilizando os mesmos dados e as mesmas opções, e se for encontrada uma execução anterior, a operação de escrita não é repetida.

Posso guardar dados para uma conta numa região geográfica diferente

Sim, pode escrever dados em contas em diferentes regiões. No entanto, se a conta de armazenamento estiver numa região diferente do nó de computação utilizado para a experiência de machine learning, o acesso a dados pode ser mais lento. Além disso, é cobrado por entrada de dados e saída na subscrição.

Parâmetros do módulo

Secção de opções Geral

Name Intervalo Tipo Predefinição Description
Origem de dados Lista Fonte de dados ou pia Armazenamento de Blobs do Azure O destino pode ser um arquivo no armazenamento Azure BLOB, uma mesa Azure, uma mesa ou vista em um Base de Dados SQL do Azure, ou uma mesa de Colmeia.
Use resultados em cache VERDADEIRO/FALSO Booleano FALSE O módulo só executa se não existir cache válido; caso contrário, utilize dados em cache da execução prévia.
Por favor, especifique o tipo de autenticação SAS/Conta AutenticaçãoType Conta Indica se as credenciais de SAS ou de conta devem ser usadas para autorização de acesso

Público ou SAS - Opções de armazenamento público

Name Intervalo Tipo Predefinição Description
SAS URI para bolha qualquer String nenhum O SAS URI do blob a ser escrito (obrigatório)
Formato de ficheiro para ficheiro SAS ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica se o ficheiro é CSV, TSV ou ARFF. (obrigatório)
Escreva a linha de cabeçalho SAS VERDADEIRO/FALSO Booleano FALSE Indica se as rubricas das colunas devem ser escritas para o ficheiro

Conta - Opções de armazenamento privado

Name Intervalo Tipo Predefinição Description
Nome da conta Azure qualquer String nenhum Nome da conta do utilizador Azure
Chave da conta Azure qualquer SecureString nenhum Chave de armazenamento azul
Caminho para blob começando com recipiente qualquer String nenhum Nome do ficheiro blob, começando com o nome do recipiente
Modo de escrita Azure Blob Armazenamento Lista: Erro, Substituição enum:BlobFileWriteMode Erro Escolha o método de escrever ficheiros blob
Formato de ficheiro para ficheiro blob ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica se o ficheiro blob é CSV, TSV ou ARFF
Escreva a linha do cabeçalho blob VERDADEIRO/FALSO Booleano FALSE Indica se o ficheiro blob deve ter a linha do cabeçalho

Exceções

Exceção Description
Erro 0027 Uma exceção ocorre quando dois objetos têm que ter o mesmo tamanho, mas não são.
Erro 0003 Uma exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0029 Uma exceção ocorre quando um URI inválido é passado.
Erro 0030 uma exceção ocorre quando não é possível descarregar um ficheiro.
Erro 0002 Ocorre uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método-alvo.
Erro 0009 Ocorre uma exceção se o nome da conta de armazenamento Azure ou o nome do recipiente forem especificados incorretamente.
Erro 0048 Uma exceção ocorre quando não é possível abrir um ficheiro.
Erro 0046 Uma exceção ocorre quando não é possível criar um diretório em caminho especificado.
Erro 0049 Uma exceção ocorre quando não é possível analisar um ficheiro.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Importar Dados
Dados de Exportação
Exportação para Base de Dados SQL do Azure
Exportação para Consulta de Colmeia
Exportação para quadro de Azure