Partilhar via


Executar código Python no designer do Azure Machine Learning

Neste artigo, você aprenderá a usar o componente Executar Script Python para adicionar lógica personalizada ao designer do Azure Machine Learning . Neste tutorial, você usa a biblioteca Pandas para fazer engenharia de recursos simples.

Você pode usar o editor de código embutido para adicionar rapidamente uma lógica Python simples. Você deve usar o método de arquivo zip para adicionar código mais complexo ou para carregar bibliotecas Python adicionais.

O ambiente de execução padrão usa a distribuição Anacondas do Python. Consulte a página de referência do componente Execute Python Script para obter uma lista completa de pacotes pré-instalados.

Executar mapa de entrada Python

Importante

Se você não vir elementos gráficos mencionados neste documento, como botões no estúdio ou designer, talvez não tenha o nível correto de permissões para o espaço de trabalho. Entre em contato com o administrador da assinatura do Azure para verificar se você recebeu o nível correto de acesso. Para obter mais informações, veja Gerir utilizadores e funções.

Execute Python escrito no designer

Adicionar o componente Executar Python Script

  1. Encontre o componente Executar Python Script na paleta do designer. Ele pode ser encontrado na seção Linguagem Python.

  2. Arraste e solte o componente na tela do pipeline.

Conectar conjuntos de dados de entrada

Este artigo usa o conjunto de dados de exemplo de dados de preço do automóvel (bruto).

  1. Arraste e solte seu conjunto de dados na tela do pipeline.

  2. Conecte a porta de saída do conjunto de dados à porta de entrada superior esquerda do componente Execute Python Script . O designer expõe a entrada como um parâmetro para o script de ponto de entrada.

    A porta de entrada direita é reservada para bibliotecas Python compactadas.

    Conectar conjuntos de dados

  3. Observe cuidadosamente a porta de entrada específica que você usa. O designer atribui a porta de entrada esquerda à variável e a porta de entrada intermediária à dataset2.dataset1

Os componentes de entrada são opcionais, uma vez que você pode gerar ou importar dados diretamente no componente Execute Python Script .

Escreva seu código Python

O designer fornece um script de ponto de entrada inicial para você editar e inserir seu próprio código Python.

Neste exemplo, você usa o Pandas para combinar duas das colunas do conjunto de dados do automóvel - Preço e Potência - para criar uma nova coluna, Dólares por cavalo de potência. Esta coluna representa quanto você paga por cada unidade de potência, o que pode se tornar um ponto de informação útil para decidir se um carro específico é um bom negócio para o seu preço.

  1. Selecione o componente Executar Python Script .

  2. No painel que aparece à direita da tela, selecione a caixa de texto do script Python.

  3. Copie e cole o seguinte código na caixa de texto:

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Seu pipeline deve se parecer com esta imagem:

    Executar pipeline Python

    O script de ponto de entrada deve conter a função azureml_main. A função tem dois parâmetros de função que mapeiam para as duas portas de entrada para o componente Execute Python Script .

    O valor de retorno deve ser um Pandas Dataframe. Você pode retornar no máximo dois dataframes como saídas de componentes.

  4. Envie o pipeline.

Agora você tem um conjunto de dados, que tem um novo recurso Dollars/HP . Este novo recurso pode ajudar a treinar um recomendado de carro. Este exemplo mostra a extração de recursos e a redução da dimensionalidade.

Próximos passos

Saiba como importar seus próprios dados no designer do Azure Machine Learning.