Compartilhar via


Exportar para Banco de Dados SQL do Azure

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Este artigo descreve como usar a opção Exportar para Banco de Dados SQL do Azure no módulo Exportar Dados no Machine Learning Studio (clássico). Essa opção é útil quando você deseja exportar dados de seu experimento de machine learning para um Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse.

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Exportar para um banco de SQL é útil em muitos cenários de aprendizado de máquina: por exemplo, talvez você queira armazenar resultados intermediários, salvar pontuações ou persistir tabelas de recursos de engenharia. Embora o armazenamento de dados em um Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse possa ser mais caro do que usar tabelas ou blobs no Azure, não há taxas de transação em SQL bancos de dados. Além disso, o armazenamento de banco de dados é ideal para escrever rapidamente quantidades menores de informações usadas com frequência, para compartilhar dados entre experimentos ou para relatórios de resultados, previsões e métricas.

Por outro lado, pode haver limites na quantidade de dados que você pode armazenar em um banco de dados, dependendo do tipo de assinatura. Você também deve considerar o uso de um banco de dados e uma conta que está na mesma região que seu workspace de machine learning.

Para exportar dados, forneça o nome da instância e o nome do banco de dados em que os dados estão armazenados e execute o módulo usando uma conta que tenha permissões de gravação. Você também deve especificar o nome da tabela e mapear as colunas do experimento para colunas na tabela.

Como exportar dados para um Banco de Dados SQL do Azure

  1. Adicione o módulo Exportar Dados ao seu experimento no Studio (clássico). Você pode encontrar este módulo na categoria Entrada e Saída de Dados.

  2. Conexão Exportar dados para o módulo que produz os dados que você deseja exportar.

  3. Para Destino de dados, selecione Banco de Dados SQL do Azure. Essa opção também SQL do Azure Data Warehouse suporte a dados.

  4. Indique o nome do servidor e do banco de dados Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse.

    Nome do servidor de banco de dados: digite o nome do servidor conforme gerado pelo Azure. Geralmente, ela contém o formulário <generated_identifier>.database.windows.net.

    Nome do banco de dados: digite o nome de um banco de dados existente no servidor que você acabou de especificar. O módulo Exportar Dados não pode criar um banco de dados.

    Nome da conta de usuário do servidor: digite o nome de usuário para uma conta que tenha permissões de acesso para o banco de dados.

    Senha da conta de usuário do servidor: forneça a senha para a conta de usuário especificada.

  5. Especifique as colunas a exportar e se você quiser renomear as colunas.

    Lista separada por vírgulas de colunas a serem salvas: digite os nomes das colunas do experimento que você deseja gravar no banco de dados.

    Nome da tabela de dados: digite o nome da tabela na qual armazenar os dados.

    Por Banco de Dados SQL do Azure, se a tabela não existir, uma nova tabela será criada.

    Por SQL do Azure Data Warehouse, a tabela já deve existir e ter o esquema correto, portanto, não se esqueça de criar com antecedência.

    Lista separada por vírgulas de colunas de tabela de dados: digite os nomes das colunas como você deseja que elas apareçam na tabela de destino.

    Por Banco de Dados SQL do Azure, você pode alterar os nomes das colunas, mas deve manter as colunas na mesma ordem em que listou as colunas para exportação, na lista separada por vírgulas de colunas a serem salvas.

    Por SQL do Azure Data Warehouse, os nomes das colunas devem corresponder àqueles que já estão no esquema da tabela de destino.

  6. Número de linhas escritas por SQL Azure operação: essa opção especifica quantas linhas devem ser escritas na tabela de destino em cada lote.

    Por padrão, o valor é definido como 50, que é o tamanho do lote padrão para Banco de Dados SQL do Azure. No entanto, você deverá aumentar esse valor se tiver um grande número de linhas a gravar.

    Por SQL do Azure Data Warehouse, é recomendável definir esse valor como 1. Se você usar um tamanho de lote maior, o tamanho da cadeia de caracteres de comando enviada ao SQL do Azure Data Warehouse poderá exceder o comprimento permitido da cadeia de caracteres, causando um erro.

  7. Usar resultados armazenados em cache: selecione esta opção para evitar a gravação de novos resultados sempre que o experimento for executado. Se não houver nenhuma outra alteração nos parâmetros do módulo, o experimento grava os dados apenas na primeira vez que o módulo é executado. No entanto, uma nova gravação sempre será executada se algum parâmetro tiver sido alterado em Exportar Dados que alteraria os resultados.

  8. Execute o experimento.

Exemplos

Para ver exemplos de como usar o módulo Exportar Dados , consulte o Galeria de IA do Azure:

  • Etapa 1 de 6 de Previsão de Varejo – pré-processamento de dados: o modelo de previsão de varejo ilustra uma tarefa de aprendizado de máquina com base nos dados armazenados no SQLDB do Azure. Ele demonstra técnicas úteis, como usar um banco de dados SQL do Azure para passar conjuntos de dados entre experimentos em contas diferentes, salvar e combinar previsões e como criar um banco de dados SQL do Azure apenas para aprendizado de máquina.

  • Criar e implantar um modelo de machine learning usando o SQL Server em uma VM do Azure: este artigo explica como usar um banco de dados SQL Server hospedado em uma VM do Azure como uma fonte para armazenar dados de treinamento e previsões. Ele também ilustra como o banco de dados relacional pode ser usado para engenharia de recursos e seleção de recursos.

  • Como usar o Azure ML com SQL do Azure Data Warehouse: demonstra o uso de dados do SQL do Azure Data Warehouse para criar um modelo de clustering.

  • Usar Machine Learning com SQL Data Warehouse: demonstra como criar um modelo de regressão para prever preços, usando dados em SQL do Azure Data Warehouse.

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Perguntas comuns

Usando um banco de dados em uma região geográfica diferente

Se o Banco de Dados SQL do Azure ou SQL Data Warehouse estiver em uma região diferente da conta de aprendizado de máquina, as gravações poderão ser mais lentas.

Além disso, você será cobrado pela entrada e saída de dados na assinatura se o nó de computação estiver em uma região diferente da conta de armazenamento.

Por que alguns caracteres nos dados de saída não são exibidos corretamente

Machine Learning dá suporte à codificação UTF-8. Se as colunas de cadeia de caracteres em seu banco de dados usarem uma codificação diferente, os caracteres poderão não ser salvos corretamente.

Além disso, Machine Learning não pode saída de tipos de dados como money.

Parâmetros do módulo

Nome Intervalo Type Padrão Descrição
Fonte de dados Lista Fonte de dados ou sink Armazenamento do Blobs do Azure A fonte de dados pode ser HTTP, FTP, HTTPS anônimo ou FTPS, um arquivo no armazenamento de BLOB do Azure, uma tabela do Azure, um Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse, uma tabela hive ou um ponto de extremidade OData.
Nome do servidor de banco de dados any Cadeia de caracteres nenhum
Nome do banco de dados any Cadeia de caracteres nenhum
Nome da conta do usuário do servidor any Cadeia de caracteres nenhum
Senha da conta do usuário do servidor nenhum
Lista separada por vírgulas de colunas a serem salvas nenhum
Nome da tabela de dados any String nenhum
Lista separada por vírgulas das colunas da tabela de dados Cadeia de caracteres Cadeia de caracteres nenhum Cadeia de caracteres
Número de linhas gravadas por operação do SQL Azure String Integer 50 String
Usar resultados em cache TRUE/FALSE Boolean FALSE O módulo só será executado se o cache válido não existir; caso contrário, use dados armazenados em cache da execução anterior.

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são.
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias.
Erro 0029 Ocorrerá uma exceção quando um URI inválido for passado.
Erro 0030 ocorrerá uma exceção quando não for possível baixar um arquivo.
Erro 0002 Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino.
Erro 0009 Ocorrerá uma exceção se o nome da conta de armazenamento do Azure ou o nome do contêiner foi especificado incorretamente.
Erro 0048 Uma exceção ocorre quando não for possível abrir um arquivo.
Erro 0015 Ocorrerá uma exceção se houve uma falha na conexão de banco de dados.
Erro 0046 Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado.
Erro 0049 Uma exceção ocorre quando não for possível analisar um arquivo.

para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

para obter uma lista de exceções de api, consulte Machine Learning códigos de erro da api REST.

Confira também

Importar dados
Exportar dados
Exportar para o Armazenamento de Blobs do Azure
Exportar para consulta do Hive
Exportar para Tabela do Azure