Importar do Banco de Dados SQL do Azure
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
este artigo descreve como usar o módulo importar dados no Machine Learning Studio (clássico) para obter dados de um Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse.
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
para importar dados de um banco de dados do, você deve especificar o nome do servidor e o nome do banco e uma instrução SQL que define a tabela, exibição ou consulta.
Em geral, o armazenamento de dados em bancos de dados do Azure é mais caro do que usar tabelas ou BLOBs no Azure. Também pode haver limites na quantidade de dados que você pode armazenar em um banco de dado, dependendo do tipo de assinatura. no entanto, não há nenhuma taxa de transação em relação ao banco de dados SQL Azure, portanto, essa opção é ideal para acesso rápido a quantidades menores de informações usadas com frequência, como tabelas de pesquisa de dados ou dicionários de dados.
O armazenamento de dados em um banco de dado do Azure também é preferível se você precisar filtrar os dados antes de lê-los ou se quiser salvar previsões ou métricas de volta no banco de dados para relatórios.
como importar dados de Banco de Dados SQL do Azure ou SQL Data Warehouse
Usar o assistente de importação de dados
O módulo apresenta um novo assistente para ajudá-lo a escolher uma opção de armazenamento, selecionar entre assinaturas e contas existentes e configurar rapidamente todas as opções.
Adicione o módulo importar dados ao seu experimento. Você pode encontrar o módulo no Studio (clássico), na categoria entrada e saída de dados .
Clique em Iniciar assistente de importação de dados e siga os prompts.
Quando a configuração estiver concluída, para realmente copiar os dados em seu experimento, clique com o botão direito do mouse no módulo e selecione executar selecionado.
Se você precisar editar uma conexão de dados existente, o assistente carregará todos os detalhes de configuração anteriores para que você não precise recomeçar do zero
Definir manualmente as propriedades no módulo importar dados
As etapas a seguir descrevem como configurar manualmente a origem da importação.
Adicione o módulo importar dados ao seu experimento. Você pode encontrar esse módulo no Studio (clássico), na categoria entrada e saída de dados .
para fonte de dados, selecione Banco de Dados SQL do Azure.
defina as seguintes opções específicas para Banco de Dados SQL do Azure ou SQL do Azure Data Warehouse.
Nome do servidor de banco de dados: digite o nome do servidor que é gerado pelo Azure. Geralmente, ela contém o formulário
<generated_identifier>.database.windows.net
.Nome do banco de dados: digite o nome de um banco de dados existente no servidor que você acabou de especificar.
Nome da conta de usuário do servidor: digite o nome de usuário de uma conta que tenha permissões de acesso para o banco de dados.
Senha da conta de usuário do servidor: forneça a senha para a conta de usuário especificada.
consulta de banco de dados: digite ou cole uma instrução SQL que descreva os dados que você deseja ler. sempre valide a instrução SQL e verifique os resultados da consulta com antecedência, usando uma ferramenta como Visual Studio Gerenciador de Servidores ou SQL Server Data Tools.
Observação
O módulo importar dados só dá suporte à inserção de nome de banco de dado, nome de conta de usuário e senha como credenciais.
se não for esperado que o conjunto de resultados lido no Machine Learning seja alterado entre as execuções do experimento, selecione a opção usar resultados em cache .
Quando essa seleção for selecionada, se não houver nenhuma outra alteração nos parâmetros do módulo, o experimento carregará os dados na primeira vez em que o módulo for executado e, depois, usará uma versão armazenada em cache do DataSet.
Se você quiser recarregar o conjunto de uma vez em cada iteração do experimento, desmarque essa opção. O conjunto de dados é recarregado a partir da origem sempre que todos os parâmetros são alterados em Import data.
Execute o experimento.
À medida que os dados de importação carregam os dados no estúdio (clássico), alguma conversão implícita de tipo também pode ser executada, dependendo dos tipos de dados usados no banco de dado de origem.
Resultados
Quando a importação for concluída, clique no conjunto de dados de saída e selecione Visualizar para ver se os dados foram importados com êxito.
Opcionalmente, você pode alterar o conjunto de e seus metadados usando as ferramentas no Studio (clássico):
Use Editar metadados para alterar nomes de coluna, converter uma coluna em um tipo de dados diferente ou para indicar quais colunas são rótulos ou recursos.
Use selecionar colunas no conjunto de linhas para selecionar um subconjunto de colunas.
Use Partition e Sample para separar o conjunto de registros por critérios ou obter as n primeiras linhas.
Exemplos
Para obter um exemplo de como usar dados de bancos de dados do Azure no aprendizado de máquina, consulte estes artigos e experimentos:
Previsão de varejo etapa 1 de 6 – pré-processamento de dados: o modelo de previsão de varejo ilustra um cenário típico que usa dados armazenados no Azure SQLDB para análise.
Ele também demonstra algumas técnicas úteis, como usar o Azure SQLDB para passar conjuntos de informações entre experimentos em contas diferentes, salvar e combinar previsões e como criar um SQLDB do Azure para aprendizado de máquina.
usar Machine Learning com SQL Data Warehouse: este artigo demonstra como criar um modelo de regressão para prever os preços usando SQL do Azure Data Warehouse.
como usar o Azure ML com SQL do Azure Data Warehouse: este artigo cria um modelo de clustering no AdventureWorks, usando importar dados e exportar dados com SQL do Azure Data Warehouse.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
Perguntas comuns
Posso filtrar os dados conforme eles estão sendo lidos da origem?
O módulo importar dados não dá suporte à filtragem, pois os dados estão sendo lidos. Recomendamos que você crie uma exibição ou defina uma consulta que gere apenas as linhas necessárias.
Observação
Se você achar que você carregou dados mais do que o necessário, você pode substituir o conjunto de dados em cache lendo um novo conjunto de dados e salvando-o com o mesmo nome que os dados mais antigos e maiores.
Por que obtenho o erro "não há suporte para o tipo decimal"?
durante a leitura de dados de um banco de SQL, você pode encontrar uma mensagem de erro relatando um tipo de dados sem suporte.
se os dados obtidos do banco de dados de SQL incluir tipos de dado que não têm suporte no Machine Learning, você deverá converter os decimais para os dados com suporte antes de ler os dados. Importar dados não pode executar automaticamente qualquer conversões que resultem em uma perda de precisão.
Para obter mais informações sobre os tipos de dados com suporte, consulte tipos de dados de módulo.
O que acontece se o banco de dados estiver em uma região geográfica diferente. O pode importar dados que ainda acessam o banco de dado? Onde os dados são armazenados?
Se o banco de dados estiver em uma região diferente da conta de aprendizado de máquina, o acesso ao dado poderá ser mais lento. Além disso, você será cobrado pela entrada e saída de dados na assinatura se o nó de computação estiver em uma região diferente da conta de armazenamento.
Os dados que você ler em seu espaço de trabalho para um experimento são salvos na conta de armazenamento associada ao experimento.
Por que alguns caracteres não são exibidos corretamente?
Machine Learning dá suporte à codificação UTF-8. Se as colunas de cadeia de caracteres em seu banco de dados usarem uma codificação diferente, os caracteres poderão não ser importados corretamente.
Uma opção é exportar os dados para um arquivo CSV no armazenamento do Azure e usar a opção CSV com codificação para especificar parâmetros para delimitadores personalizados, a página de código e assim por diante.
Parâmetros do módulo
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Fonte de dados | Lista | Fonte de dados ou coletor | Armazenamento do Blobs do Azure | a fonte de dados pode ser HTTP, FTP, HTTPS anônimo ou FTPS, um arquivo no armazenamento de blobs do azure, uma tabela do azure, um Banco de Dados SQL do Azure, um banco de dados SQL Server local, uma tabela Hive ou um ponto de extremidade OData. |
URI do servidor HDFS | any | Cadeia de caracteres | nenhum | Ponto de extremidade REST do HDFS |
Nome do servidor de banco de dados | any | String | nenhum | Nome da conta de armazenamento do Azure |
Nome do banco de dados | any | SecureString | nenhum | Chave de armazenamento do Azure |
Nome da conta do usuário do servidor | any | Cadeia de caracteres | nenhum | Nome do contêiner do Azure |
Nome da conta do usuário do servidor | Lista (subconjunto) | Conteúdo da URL | OData | Tipo de formato de dado |
Consulta do banco de dados | any | Cadeia de caracteres | nenhum | Tipo de formato de dado |
Usar resultados armazenados em cache | TRUE/FALSE | Boolean | FALSE | descrição |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Conjunto de dados de resultados | Tabela de Dados | Conjunto de dados com dados baixados |
Exceções
Exceção | Descrição |
---|---|
Erro 0027 | Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são. |
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias. |
Erro 0029 | Ocorrerá uma exceção quando um URI inválido for passado. |
Erro 0030 | ocorrerá uma exceção quando não for possível baixar um arquivo. |
Erro 0002 | Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino. |
Erro 0009 | Ocorrerá uma exceção se o nome da conta de armazenamento do Azure ou o nome do contêiner foi especificado incorretamente. |
Erro 0048 | Uma exceção ocorre quando não for possível abrir um arquivo. |
Erro 0015 | Ocorrerá uma exceção se houve uma falha na conexão de banco de dados. |
Erro 0046 | Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado. |
Erro 0049 | Uma exceção ocorre quando não for possível analisar um arquivo. |
Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.
Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.
Confira também
Importar dados
Exportar dados
Importar da URL da Web via HTTP
Importar da consulta do Hive
Importar da Tabela do Azure
Importar do Armazenamento de Blobs do Azure
Importar de provedores de feed de dados
Importar de um Banco de dados do SQL Server local