Exportar para Tabela do Azure
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Este artigo descreve como usar a opção Exportar para o Azure no módulo Exportar Dados no Machine Learning Studio (clássico).
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Essa opção é útil quando você deseja exportar resultados ou dados intermediários de um experimento de machine learning para uma tabela do Azure. O serviço tabela do Azure é um serviço de gerenciamento de dados no Azure que pode armazenar grandes quantidades de dados estruturados e não relacionais. É um armazenamento de dados NoSQL que aceita chamadas autenticadas de dentro e fora do Azure.
Como exportar dados para uma tabela do Azure
Adicione o módulo Exportar Dados ao seu experimento. Você pode encontrar este módulo na categoria Entrada e Saída de Dados no Studio (clássico).
Conexão para o módulo que produz os dados que você deseja exportar para o armazenamento de tabelas do Azure.
Especifique se deseja exportar dados para um recurso compartilhado público ou para uma conta de armazenamento privada que requer credenciais de logon, definindo a opção Tipo de autenticação.
Público (URL de SAS): escolha esta opção se a conta for compatível com o acesso por meio da URL SAS. No campo URI de SAS de Tabela, digite ou colar o URI completo que define a conta e o blob público.
A URL de SAS é uma URL de acesso com limite de tempo que você pode gerar usando um utilitário de armazenamento do Azure. Em uma página acessível por meio da URL de SAS, os dados podem ser armazenados usando apenas estes formatos: CSV, TSV e ARFF.
Conta: escolha esta opção se os dados estão em uma conta privada. Você também deve fornecer credenciais, incluindo o nome da conta e a chave.
Se você quiser exportar seus dados para armazenamento seguro e privado, forneça as credenciais necessárias para acessar a conta:
Nome da conta de tabela: digite ou colar o nome da conta que contém o blob que você deseja acessar. Por exemplo, se a URL completa da conta de armazenamento for
https://myshared.table.core.windows.net
, digitemyshared
.Chave de conta de tabela: colar a chave de acesso associada à conta de armazenamento.
Nome da tabela: digite o nome da tabela específica que você deseja ler.
Especifique quais colunas salvar no armazenamento de tabelas e quais colunas usar na definição do esquema de tabela usando as propriedades da coluna.
Chave de partição: escolha a coluna que deve ser usada para particionar o conjuntos de dados salvo para a tabela no Azure Armazenamento. As tabelas no Azure são particionadas para oferecer suporte ao balanceamento de carga entre os nós de armazenamento. Todas as entidades de tabela são organizadas por partição; portanto, a propriedade PartitionKey é necessária para todas as operações de tabela.
Chave de linha da tabela do Azure: escolha a coluna que deve ser usada para a propriedade RowKey . A propriedade RowKey é uma propriedade do sistema necessária para cada entidade em uma tabela. Junto com a propriedade PartitionKey , ela forma um índice exclusivo para cada linha na tabela.
Observação
Você deve usar colunas diferentes para RowKey e PartitionKey. Certifique-se de que qualquer coluna selecionada para RowKey ou PartitionKey também seja incluída na lista de colunas de destino ou se um erro será gerado.
- Colunas de origem da tabela do Azure: selecione as colunas adicionais do conjuntos de dados que você deseja salvar na tabela do Azure. Você também deve incluir as colunas selecionadas para PartitionKey e RowKey.
Para obter mais informações sobre tabelas no Azure Armazenamento, consulte Noções básicas sobre o modelo de dados do serviço tabela.
Especifique os nomes das colunas a gravar na tabela.
Importante
Você deve fornecer um nome de coluna para cada coluna que você saída para a tabela, incluindo RowKey, PartitionKey e todas as colunas de origem.
Se o número de nomes de coluna que você fornecer não corresponder ao número de colunas de saída, um erro será gerado.
Se você digitar novos nomes de coluna, eles deverão ser fornecidos na ordem dos índices de coluna das colunas de origem.
Modo de gravação de tabela do Azure: indique como você deseja que os Dados de Exportação se comportem quando os dados já existirem na tabela do Azure.
Inserir: a
Insert Entity
operação insere uma nova entidade com uma chave primária exclusiva, que é formada de uma combinação das propriedades PartitionKey e RowKey .Mesclagem: a
Merge Entity
operação atualiza uma entidade existente atualizando as propriedades da entidade. Essa operação não substitui a entidade existente.Substituir: a
Update Entity
operação substitui o conteúdo da entidade determinada em uma tabela.InsertOrReplace: a
InsertOrReplace Entity
operação insere a entidade se a entidade não existir. Se a entidade existir, substituirá a entidade existente.InsertOrMerge: a
InsertOrMerge Entity
operação insere a entidade se a entidade não existir. Se a entidade existir, ele mescla as propriedades de entidade fornecidas com as existentes.
Usar resultados armazenados em cache: indique se deseja que os dados sejam atualizados sempre que o experimento for executado.
Se você selecionar essa opção, o módulo Exportar Dados salvará os dados na tabela especificada na primeira vez que o experimento for executado e, depois disso, não executará gravações, a menos que haja alterações upstream.
Se você desmarcar essa opção, os dados serão gravados no destino sempre que o experimento for executado, independentemente de os dados ser os mesmos ou não.
Execute o experimento.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
Perguntas comuns
Por que eu fiz um erro ao escrever em uma tabela existente
Verifique o esquema da tabela para verificar se os nomes das colunas e os tipos de dados são os mesmos. Por exemplo, no armazenamento de tabelas do Azure, espera-se que a coluna ID seja uma cadeia de caracteres.
Se você receber o erro Erro 0027: O tamanho dos objetos passados é inconsistente, verifique se a tabela existe no contêiner especificado. Atualmente, o Azure ML pode gravar somente em tabelas existentes.
Por que eu vejo o erro de que uma coluna existente não pode ser encontrada
Se você não tiver executado o experimento, as colunas upstream às vezes não serão detectadas pelos Dados de Exportação. Se você fizer alterações upstream no experimento, talvez seja necessário remover o módulo Exportar Dados e, em seguida, adicioná-lo e reconfigurá-lo.
Como evitar a reescrevê-lo desnecessariamente
Se os dados em seu experimento mudarem por algum motivo, o módulo Exportar Dados sempre gravará os novos dados.
No entanto, se você estiver executando o experimento com outras alterações que não afetam os resultados, de definir a opção Usar resultados armazenados em cache como TRUE. O módulo verificará se o experimento foi executado anteriormente usando as mesmas opções e, se um resultado anterior for encontrado, os dados não serão gravados na tabela do Azure.
Posso exportar dados para uma região geográfica diferente
Sim. No entanto, se a conta de armazenamento estiver em uma região diferente do nó de computação usado para o experimento de machine learning, o acesso a dados poderá ser mais lento. Além disso, você será cobrado pela entrada e saída de dados na assinatura.
Exemplos
Para ver exemplos de como usar esses módulos de aprendizado de máquina, consulte o Galeria de IA do Azure.
Parâmetros do módulo
Público ou SAS – Opções públicas
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
URI da SAS de tabela | any | Cadeia de caracteres |
Conta – Opções de conta privada
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Nome da conta de tabela | ||||
Chave de conta de tabela | any | SecureString |
Opções de armazenamento
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Nome da tabela | Cadeia de caracteres | nenhum | ||
Chave de partição | any | SecureString | nenhum | Escolha a coluna a ser usada como a chave ao particionar a tabela. Se nenhuma coluna for selecionada, o nome da coluna como a chave de partição para todas as entradas |
Chave de linha de tabela do Azure | any | Columnpickerfor | nenhum | Escolha a coluna que contém o identificador exclusivo para linhas de tabela. Usa como padrão uma chave de linha baseada em GUID |
Colunas de origem de tabela do Azure | any | Columnpickerfor | nenhum | Especificar quais colunas incluir na tabela, seja por nome ou por índice de coluna |
Colunas de destino da tabela do Azure | any | String | nenhum | Digite os nomes das colunas a serem usadas na tabela de destino |
Modo de gravação de tabela do Azure | Lista: inserir, mesclar, substituir, InsertOrReplace, InsertOrMerge | Enumeração | nenhum | |
Usar resultados em cache | TRUE/FALSE | Boolean | FALSE | O módulo só será executado se o cache válido não existir; caso contrário, use dados armazenados em cache da execução anterior. |
Exceções
Exceção | Descrição |
---|---|
Erro 0027 | Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são. |
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias. |
Erro 0029 | Ocorrerá uma exceção quando um URI inválido for passado. |
Erro 0030 | ocorrerá uma exceção quando não for possível baixar um arquivo. |
Erro 0002 | Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino. |
Erro 0009 | Ocorrerá uma exceção se o nome da conta de armazenamento do Azure ou o nome do contêiner foi especificado incorretamente. |
Erro 0048 | Uma exceção ocorre quando não for possível abrir um arquivo. |
Erro 0046 | Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado. |
Erro 0049 | Uma exceção ocorre quando não for possível analisar um arquivo. |
para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.
para obter uma lista de exceções de api, consulte Machine Learning códigos de erro da api REST.
Confira também
Importar dados
Exportar dados
Exportar para Banco de Dados SQL do Azure
Exportar para o Armazenamento de Blobs do Azure
Exportar para consulta do Hive