Importar de um Banco de dados do SQL Server local
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Este artigo descreve como usar o módulo Importar Dados no Machine Learning Studio (clássico) para importar dados de um banco de dados SQL Server local para um experimento de machine learning.
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Machine Learning pode acessar um banco de dados SQL Server local se os dados são fornecidos usando um Gateway do Microsoft Gerenciamento de Dados. Portanto, antes de usar Importar Dados, você deve atender a estes requisitos:
- Instalar um Gateway Gerenciamento de Dados Microsoft que pode acessar a fonte de dados
- Registrar o gateway em seu Machine Learning workspace
- Configurar os Dados de Importação para identificar o gateway
Depois que a conexão de gateway for estabelecida, você poderá especificar propriedades adicionais, como os nomes do servidor e do banco de dados, o método de autenticação e uma consulta de banco de dados.
Como instalar um Gateway do Microsoft Gerenciamento de Dados
Para acessar um banco de dados SQL Server local no Machine Learning, você precisa baixar e instalar o Gateway do Microsoft Gerenciamento de Dados e registrar o gateway no Machine Learning Studio (clássico).
Para obter detalhes sobre como instalar e registrar o gateway, consulte estes artigos:
Executar análises avançadas com Machine Learning usando dados de um banco de dados SQL Server local
Solucionar problemas com o uso Gerenciamento de Dados Gateway]
Como importar dados de um banco de dados SQL Server local
Depois que um gateway Gerenciamento de Dados tiver sido instalado em um computador em que ele possa acessar o banco de dados SQL Server e você tiver registrado o gateway no Machine Learning Studio (clássico), você deverá configurar o módulo Importar Dados.
Antes de começar, desabilite o bloqueador pop-up do navegador para o site, studio.azureml.net
.
Se você estiver usando o navegador Google Chrome, deverá baixar e instalar um dos plug-ins que estão disponíveis no Google Chrome WebStore: clique em Extensão de Aplicativo uma vez.
Usar o Assistente de Importação de Dados
O módulo apresenta um novo assistente para ajudá-lo a escolher uma opção de armazenamento, selecionar entre assinaturas e contas existentes e configurar rapidamente todas as opções.
Adicione o módulo Importar Dados ao seu experimento. Você pode encontrar o módulo no Studio (clássico), na categoria Entrada e Saída de Dados.
Clique em Iniciar Assistente de Importação de Dados e siga os prompts.
Quando a configuração for concluída, para realmente copiar os dados em seu experimento, clique com o botão direito do mouse no módulo e selecione Executar Selecionado.
Se você precisar editar uma conexão de dados existente, o assistente carregará todos os detalhes de configuração anteriores para que você não precise iniciar novamente do zero.
Definir propriedades manualmente no módulo Importar Dados
Adicione o módulo Importar Dados ao seu experimento. Você pode encontrar o módulo no Studio (clássico), na categoria Entrada e Saída de Dados.
Para Fonte de dados, selecione Local Banco de Dados SQL.
De definir as opções a seguir específicas para o banco de SQL Server dados.
Gateway de dados: selecione o gateway que você criou. O gateway deve ser registrado ou não aparece na lista.
Nome do servidor de banco de dados: digite o nome da SQL Server instância.
Nome do banco de dados: digite o nome do banco de dados.
Clique em Inserir valores em Nome de usuário e senha e insira suas credenciais de banco de dados. Você pode usar a Autenticação Integrada do Windows ou Autenticação do SQL Server dependendo de como o SQL Server local está configurado.
Importante
O gerenciador de credenciais deve ser lançado de dentro da mesma rede que a instância SQL Server e o cliente de gateway. As credenciais não podem ser passadas entre domínios.
Digite ou colar em Consulta de banco de SQL uma instrução SQL que descreve os dados que você deseja ler. Sempre valide a SQL e verifique os resultados da consulta com antecedência, usando uma ferramenta como Visual Studio Gerenciador de Servidores ou SQL Server Data Tools.
Se não for esperado que o conjuntos de dados altere entre as executações do experimento, selecione a opção Usar resultados armazenados em cache . Quando essa opção é selecionada, se não houver nenhuma outra alteração nos parâmetros do módulo, o experimento carregará os dados na primeira vez que o módulo for executado e, em seguida, usará uma versão armazenada em cache do conjuntos de dados.
Execute o experimento.
Resultados
Como Importar Dados carrega os dados no Studio (clássico), algumas conversões implícitas de tipo podem ser executadas, dependendo dos tipos de dados usados no banco de dados de origem. Para obter mais informações sobre tipos de dados, consulte Tipos de dados de módulo.
Ao concluir, clique no conjuntos de dados de saída e selecione Visualizar para ver se os dados foram importados com êxito.
Opcionalmente, você pode alterar o conjuntos de dados e seus metadados usando as ferramentas no Studio (clássico):
Use Editar Metadados para alterar nomes de coluna, converter uma coluna em um tipo de dados diferente ou para indicar quais colunas são rótulos ou recursos.
Use Selecionar Colunas no Conjuntos de Dados para selecionar um subconjunto de colunas.
Use Partição e Exemplo para separar o conjuntos de dados por critérios ou obter as n primeiras linhas.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
Perguntas comuns
Posso filtrar os dados conforme eles estão sendo lidos da origem?
O módulo Importar Dados em si não dá suporte à filtragem à medida que os dados estão sendo lidos. Recomendamos que você crie uma exibição ou defina uma consulta que gere apenas as linhas de que você precisa.
Observação
Se você achar que você carregou dados mais do que o necessário, você pode substituir o conjunto de dados em cache lendo um novo conjunto de dados e salvando-o com o mesmo nome que os dados mais antigos e maiores.
Por que eu vejo o erro "Não há suporte para o tipo Decimal"
Ao ler dados de um banco de SQL, você pode encontrar uma mensagem de erro relatando um tipo de dados sem suporte.
Se os dados que você obter do banco de dados SQL incluirem tipos de dados que não têm suporte no Machine Learning, você deverá converter os decimais em um tipo de dados com suporte antes de ler os dados. O motivo é que Importar Dados não pode executar automaticamente nenhuma conversão que resultaria em perda de precisão.
Por que alguns caracteres não são exibidos corretamente
Machine Learning dá suporte à codificação UTF-8. Se as colunas de cadeia de caracteres no banco de dados usarem uma codificação diferente, os caracteres poderão não ser importados corretamente.
Uma opção para preservar esses caracteres é exportar os dados para um arquivo CSV no armazenamento do Azure e usar a opção CSV com codificação para especificar parâmetros para delimitadores personalizados, a página de código e assim por diante.
Eu configurar um Gerenciamento de Dados Gateway no meu servidor local. Posso compartilhar o mesmo gateway entre workspaces
Não. Você deve criar um gateway separado para cada workspace.
Embora você possa configurar vários Gateways Gerenciamento de Dados em um único workspace (por exemplo, um para desenvolvimento, teste, produção etc.), um gateway não pode ser compartilhado entre workspaces.
Eu tenho um gateway Gerenciamento de Dados em meu servidor local que uso para Power BI ou Azure Data Factory e quero usar o mesmo gateway para Machine Learning
Cada serviço requer um gateway Gerenciamento de Dados separado. Se você já tiver um gateway que está sendo usado para Power BI ou Azure Data Factory, deverá configurar um servidor separado e instalar um gateway para aprendizado de máquina.
Não é possível instalar vários gateways em um único servidor.
Quero poder exportar dados para meu servidor SQL local. Posso usar o gateway com o módulo Exportar Dados para gravar dados em meu servidor SQL local?
Atualmente, o Machine Learning dá suporte apenas à importação de dados. Estamos avaliando se você poderá gravar em seu banco de dados local no futuro. Enquanto isso, você pode usar Azure Data Factory para copiar dados da nuvem para seu banco de dados local.
Tenho uma fonte de dados que não é Microsoft SQL Server (Oracle, Teradata etc.). Posso ler os dados no Machine Learning usando a opção local no módulo Importar Dados?
Atualmente, o módulo Machine Learning Importar Dados dá suporte apenas a Microsoft SQL Server.
Como alternativa, você pode usar o Azure Data Factory para copiar seus dados locais para o armazenamento em nuvem, como o Armazenamento de Blobs do Azure ou o Banco de Dados do Azure, e, em seguida, usar sua fonte de dados de nuvem no módulo Importar Dados.
Parâmetros do módulo
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Fonte de dados | Lista | Fonte de dados ou sink | Armazenamento do Blobs do Azure | A fonte de dados pode ser HTTP, FTP, HTTPS anônimo ou FTPS, um arquivo no armazenamento de BLOB do Azure, uma tabela do Azure, um Banco de Dados SQL do Azure, um banco de dados SQL Server local, uma tabela hive ou um ponto de extremidade OData. |
Gateway de dados | any | DataGatewayName | nenhum | Nome do gateway de dados |
Nome do servidor de banco de dados | any | String | nenhum | SQL Server local |
Nome do banco de dados | any | String | nenhum | Instância de banco de SQL Server local |
Nome e senha do usuário | any | SecureString | nenhum | Nome e senha do usuário |
Consulta do banco de dados | any | StreamReader | nenhum | Consulta SQL local |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Conjunto de dados de resultados | Tabela de Dados | Conjunto de dados com dados baixados |
Exceções
Exceção | Descrição |
---|---|
Erro 0027 | Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são. |
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias. |
Erro 0029 | Ocorrerá uma exceção quando um URI inválido for passado. |
Erro 0030 | ocorrerá uma exceção quando não for possível baixar um arquivo. |
Erro 0002 | Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino. |
Erro 0048 | Uma exceção ocorre quando não for possível abrir um arquivo. |
Erro 0015 | Ocorrerá uma exceção se houve uma falha na conexão de banco de dados. |
Erro 0046 | Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado. |
Erro 0049 | Uma exceção ocorre quando não for possível analisar um arquivo. |
Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.
Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.
Confira também
Importar dados
Exportar dados
Importar da URL da Web via HTTP
Importar da consulta do Hive
Importar do Banco de Dados SQL do Azure
Importar da Tabela do Azure
Importar do Armazenamento de Blobs do Azure
Importar de provedores de feed de dados