Executar código Python no designer do Azure Machine Learning
Neste artigo, você aprenderá a usar o componente Executar Script Python para adicionar lógica personalizada ao designer do Azure Machine Learning . Neste tutorial, você usa a biblioteca Pandas para fazer engenharia de recursos simples.
Você pode usar o editor de código embutido para adicionar rapidamente uma lógica Python simples. Você deve usar o método de arquivo zip para adicionar código mais complexo ou para carregar bibliotecas Python adicionais.
O ambiente de execução padrão usa a distribuição Anacondas do Python. Consulte a página de referência do componente Execute Python Script para obter uma lista completa de pacotes pré-instalados.
Importante
Se você não vir elementos gráficos mencionados neste documento, como botões no estúdio ou designer, talvez não tenha o nível correto de permissões para o espaço de trabalho. Entre em contato com o administrador da assinatura do Azure para verificar se você recebeu o nível correto de acesso. Para obter mais informações, veja Gerir utilizadores e funções.
Execute Python escrito no designer
Adicionar o componente Executar Python Script
Encontre o componente Executar Python Script na paleta do designer. Ele pode ser encontrado na seção Linguagem Python.
Arraste e solte o componente na tela do pipeline.
Conectar conjuntos de dados de entrada
Este artigo usa o conjunto de dados de exemplo de dados de preço do automóvel (bruto).
Arraste e solte seu conjunto de dados na tela do pipeline.
Conecte a porta de saída do conjunto de dados à porta de entrada superior esquerda do componente Execute Python Script . O designer expõe a entrada como um parâmetro para o script de ponto de entrada.
A porta de entrada direita é reservada para bibliotecas Python compactadas.
Observe cuidadosamente a porta de entrada específica que você usa. O designer atribui a porta de entrada esquerda à variável e a porta de entrada intermediária à
dataset2
.dataset1
Os componentes de entrada são opcionais, uma vez que você pode gerar ou importar dados diretamente no componente Execute Python Script .
Escreva seu código Python
O designer fornece um script de ponto de entrada inicial para você editar e inserir seu próprio código Python.
Neste exemplo, você usa o Pandas para combinar duas das colunas do conjunto de dados do automóvel - Preço e Potência - para criar uma nova coluna, Dólares por cavalo de potência. Esta coluna representa quanto você paga por cada unidade de potência, o que pode se tornar um ponto de informação útil para decidir se um carro específico é um bom negócio para o seu preço.
Selecione o componente Executar Python Script .
No painel que aparece à direita da tela, selecione a caixa de texto do script Python.
Copie e cole o seguinte código na caixa de texto:
import pandas as pd def azureml_main(dataframe1 = None, dataframe2 = None): dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower return dataframe1
Seu pipeline deve se parecer com esta imagem:
O script de ponto de entrada deve conter a função
azureml_main
. A função tem dois parâmetros de função que mapeiam para as duas portas de entrada para o componente Execute Python Script .O valor de retorno deve ser um Pandas Dataframe. Você pode retornar no máximo dois dataframes como saídas de componentes.
Envie o pipeline.
Agora você tem um conjunto de dados, que tem um novo recurso Dollars/HP . Este novo recurso pode ajudar a treinar um recomendado de carro. Este exemplo mostra a extração de recursos e a redução da dimensionalidade.
Próximos passos
Saiba como importar seus próprios dados no designer do Azure Machine Learning.