Partilhar via


core Pacote

Contém a funcionalidade principal para pipelines do Azure Machine Learning, que são fluxos de trabalho configuráveis de machine learning.

Os pipelines do Azure Machine Learning permitem-lhe criar fluxos de trabalho de machine learning resutilizáveis que podem ser utilizados como modelo para os seus cenários de machine learning. Este pacote contém a funcionalidade principal para trabalhar com pipelines do Azure ML e é normalmente utilizado juntamente com as classes no steps pacote.

Um pipeline de machine learning é representado por uma coleção de PipelineStep objetos que podem ser sequenciados e paralelos ou criados com dependências explícitas entre passos. Os passos do pipeline são utilizados para definir um Pipeline objeto que representa o fluxo de trabalho a executar. Pode criar e trabalhar com pipelines num Jupyter Notebook ou em qualquer outro IDE com o SDK do Azure ML instalado.

Os pipelines do Azure ML permitem-lhe concentrar-se no machine learning e não na infraestrutura. Para começar a criar um pipeline, consulte https://aka.ms/pl-first-pipeline.

Para obter mais informações sobre os benefícios do Pipeline do Machine Learning e como está relacionado com outros pipelines oferecidos pelo Azure, veja O que são os pipelines de ML no serviço Azure Machine Learning?

Módulos

builder

Define as classes para criar um pipeline do Azure Machine Learning.

Um gráfico de pipeline é composto por passos de pipeline (PipelineStep), dados de pipeline opcionais (PipelineData) produzidos ou consumidos em cada passo e uma sequência de execução de passos opcional (StepSequence).

graph

Define classes para a construção de gráficos de pipeline do Azure Machine Learning.

Os gráficos de pipeline do Azure ML são criados para Pipeline objetos, quando utiliza PipelineStep (e classes derivadas), PipelineDatae PipelineData objetos. Em casos de utilização típicos, não terá de utilizar diretamente as classes neste módulo.

Um gráfico de execução de pipeline consiste em nós de módulo que representam unidades básicas, como uma origem de dados ou um passo. Os nós podem ter portas de entrada e portas de saída e parâmetros associados. As arestas definem relações entre duas portas de nó num gráfico.

module

Contém classes para criar e gerir unidades computacionais resutilizáveis de um pipeline do Azure Machine Learning.

Os módulos permitem-lhe criar unidades computacionais num Pipeline, que podem ter entradas, saídas e depender de parâmetros e de uma configuração de ambiente para operar. Um módulo pode ser versado e ser utilizado em diferentes pipelines do Azure Machine Learning ao contrário PipelineStep (e classes derivadas) que são utilizados num Pipeline.

Os módulos foram concebidos para serem reutilizados em vários pipelines e podem evoluir para adaptar uma lógica de computação específica para diferentes casos de utilização. Um passo num pipeline pode ser utilizado em iterações rápidas para melhorar um algoritmo e, assim que o objetivo for alcançado, o algoritmo é geralmente publicado como um módulo para permitir a reutilização.

module_step_base

Contém funcionalidades para adicionar um passo a um pipeline com uma versão de um Module.

pipeline

Define a classe para criar fluxos de trabalho reutilizáveis do Azure Machine Learning.

pipeline_draft

Define classes para gerir pipelines mutáveis.

pipeline_endpoint

Define classes para gerir pipelines, incluindo controlo de versões e pontos finais.

pipeline_output_dataset

Contém funcionalidades para promover uma saída intermédia para um Conjunto de Dados do Azure Machine Learning.

Por predefinição, os dados intermédios (saída) num pipeline não se tornarão num Conjunto de Dados do Azure Machine Learning. Para promover dados intermédios para um Conjunto de Dados do Azure Machine Learning, chame o as_dataset método na classe PipelineData para devolver um PipelineOutputFileDataset objeto. A partir de um objeto PipelineOutputFileDataset, pode criar um PipelineOutputTabularDataset objeto.

run

Define classes para pipelines submetidos, incluindo classes para verificar o estado e obter detalhes de execução.

schedule

Define as classes para agendar submissões de Pipelines do Azure Machine Learning.

Classes

InputPortBinding

Define um enlace de uma origem para uma entrada de um passo de pipeline.

Um InputPortBinding pode ser utilizado como uma entrada para um passo. A origem pode ser , PortDataReferencePipelineData, , DataReference, PipelineDatasetou OutputPortBinding.

InputPortBinding é útil para especificar o nome da entrada do passo, se deve ser diferente do nome do objeto de enlace (ou seja, para evitar nomes de entrada/saída duplicados ou porque o script de passo precisa de uma entrada para ter um determinado nome). Também pode ser utilizado para especificar o bind_mode para PythonScriptStep entradas.

Inicializar InputPortBinding.

Module

Representa uma unidade de computação utilizada num pipeline do Azure Machine Learning.

Um módulo é uma coleção de ficheiros que será executada num destino de computação e uma descrição de uma interface. A coleção de ficheiros pode ser script, binários ou quaisquer outros ficheiros necessários para serem executados no destino de computação. A interface do módulo descreve as definições de entradas, saídas e parâmetros. Não os vincula a valores ou dados específicos. Um módulo tem um instantâneo associado ao mesmo, que captura a coleção de ficheiros definidos para o módulo.

Inicializar Módulo.

ModuleVersion

Representa a unidade de computação real dentro de um Module.

Não deve utilizar esta classe diretamente. Em vez disso, utilize um dos métodos de publicação da Module classe.

Inicializar ModuleVersion.

ModuleVersionDescriptor

Define a versão e o ID de um ModuleVersion.

Inicializar ModuleVersionDescriptor.

OutputPortBinding

Define uma saída com nome de um passo de pipeline.

OutputPortBinding pode ser utilizado para especificar o tipo de dados que serão produzidos por um passo e como os dados serão produzidos. Pode ser utilizado com InputPortBinding para especificar que o resultado do passo é uma entrada necessária de outro passo.

Inicializar OutputPortBinding.

Pipeline

Representa uma coleção de passos que podem ser executados como um fluxo de trabalho reutilizável do Azure Machine Learning.

Utilize um Pipeline para criar e gerir fluxos de trabalho que juntam várias fases de machine learning. Cada fase de machine learning, como a preparação de dados e a preparação de modelos, pode consistir num ou mais passos num Pipeline.

Para obter uma descrição geral do porquê e quando utilizar Pipelines, consulte https://aka.ms/pl-concept.

Para obter uma descrição geral sobre a construção de um Pipeline, consulte https://aka.ms/pl-first-pipeline.

Inicializar Pipeline.

PipelineData

Representa dados intermédios num pipeline do Azure Machine Learning.

Os dados utilizados no pipeline podem ser produzidos por um passo e consumidos noutro passo ao fornecer um objeto PipelineData como uma saída de um passo e uma entrada de um ou mais passos subsequentes.

Tenha em atenção que, se estiver a utilizar os dados do pipeline, certifique-se de que o diretório utilizado existia.

Um exemplo de python para garantir que o diretório existia, suponha que tem uma porta de saída com o nome output_folder num passo de pipeline. Pretende escrever alguns dados para um caminho relativo nesta pasta.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData use DataReference subjacente, que já não é a abordagem recomendada para o acesso e entrega de dados, utilize OutputFileDatasetConfig em vez disso, pode encontrar exemplo aqui: Pipeline com OutputFileDatasetConfig.

Inicializar PipelineData.

PipelineDataset

Atua como adaptador para Conjunto de Dados e Pipeline.

Nota

Esta classe foi preterida. Saiba como utilizar o conjunto de dados com o pipeline, consulte https://aka.ms/pipeline-with-dataset.

Esta é uma classe interna. Não deve criar esta classe diretamente, mas sim chamar os métodos de instância as_* nas classes Conjunto de Dados ou OutputDatasetConfig.

Aja como adaptador para Conjunto de Dados e Pipeline.

Esta é uma classe interna. Não deve criar esta classe diretamente, mas sim chamar os métodos de instância as_* nas classes Conjunto de Dados ou OutputDatasetConfig.

PipelineDraft

Representa um pipeline mutável que pode ser utilizado para submeter execuções e criar Pipelines Publicados.

Utilize PipelineDrafts para iterar em Pipelines. Os PipelineDrafts podem ser criados de raiz, outro PipelineDraft ou pipelines existentes: Pipeline, PublishedPipelineou PipelineRun.

Inicializar PipelineDraft.

PipelineEndpoint

Representa um Pipeline fluxo de trabalho que pode ser acionado a partir de um URL de ponto final exclusivo.

Os PipelineEndpoints podem ser utilizados para criar novas versões de um PublishedPipeline enquanto mantêm o mesmo ponto final. Os PipelineEndpoints têm um nome exclusivo numa área de trabalho.

Com o atributo de ponto final de um objeto PipelineEndpoint, pode acionar novas execuções de pipeline a partir de aplicações externas com chamadas REST. Para obter informações sobre como autenticar ao chamar pontos finais REST, consulte https://aka.ms/pl-restep-auth.

Para obter mais informações sobre como criar e executar pipelines de machine learning, consulte https://aka.ms/pl-first-pipeline.

Inicializar PipelineEndpoint.

PipelineParameter

Define um parâmetro numa execução de pipeline.

Utilize PipelineParameters para construir Pipelines versáteis que podem ser novamente submetidos mais tarde com valores de parâmetros variáveis.

Inicializar parâmetros de pipeline.

PipelineRun

Representa uma execução de um Pipeline.

Esta classe pode ser utilizada para gerir, verificar o estado e obter detalhes de execução assim que uma execução do pipeline for submetida. Utilize get_steps para obter os StepRun objetos criados pela execução do pipeline. Outras utilizações incluem obter o Graph objeto associado à execução do pipeline, obter o estado da execução do pipeline e aguardar a conclusão da execução.

Inicializar uma execução de Pipeline.

PipelineStep

Representa um passo de execução num pipeline do Azure Machine Learning.

Os pipelines são construídos a partir de vários passos de pipeline, que são unidades computacionais distintas no pipeline. Cada passo pode ser executado de forma independente e utilizar recursos de computação isolados. Normalmente, cada passo tem as suas próprias entradas, saídas e parâmetros nomeados.

A classe PipelineStep é a classe base a partir da qual outras classes de passos incorporadas concebidas para cenários comuns herdam, como PythonScriptStep, DataTransferStepe HyperDriveStep.

Para obter uma descrição geral da forma como os Pipelines e pipelines se relacionam, veja O que são Pipelines de ML.

Inicializar PipelineStep.

PortDataReference

Modelos de dados associados a uma saída de uma StepRun concluída.

Um objeto PortDataReference pode ser utilizado para transferir os dados de saída produzidos por um StepRun. Também pode ser utilizado como uma entrada de passo num futuro Pipeline.

Inicializar PortDataReference.

PublishedPipeline

Representa um Pipeline a ser submetido sem o código Python que o construiu.

Além disso, uma PublishedPipeline pode ser utilizada para voltar a submeter uma Pipeline com valores e entradas diferentes PipelineParameter .

Inicializar PublishedPipeline.

:p os pontos finais O URL do ponto final REST para submeter execuções de pipeline para este pipeline. :type endpoint: str :p aram total_run_steps: O número de passos neste pipeline :tipo total_run_steps: área de trabalho int :p aram: a área de trabalho do pipeline publicado. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Se pretende continuar a execução de outros passos no PipelineRun

se um passo falhar, a predefinição é falsa.

Schedule

Define uma agenda para submeter um pipeline.

Assim que um Pipeline for publicado, pode ser utilizada uma Agenda para submeter o Pipeline num intervalo especificado ou quando são detetadas alterações a uma localização de armazenamento de Blobs.

Inicializar Agenda.

ScheduleRecurrence

Define a frequência, o intervalo e a hora de início de um pipeline Schedule.

ScheduleRecurrence também lhe permite especificar o fuso horário e as horas ou minutos ou dias semanais para a periodicidade.

Inicialize uma periodicidade de agenda.

Também permite especificar o fuso horário e as horas ou minutos ou dias da semana para a periodicidade.

StepRun

Uma execução de um passo num Pipeline.

Esta classe pode ser utilizada para gerir, verificar o estado e obter detalhes de execução assim que a execução do pipeline principal for submetida e o pipeline tiver submetido a execução do passo.

Inicializar uma StepRun.

StepRunOutput

Representa uma saída criada por um StepRun num Pipeline.

O StepRunOutput pode ser utilizado para aceder ao PortDataReference criado pelo passo.

Inicializar StepRunOutput.

StepSequence

Representa uma lista de passos numa Pipeline ordem e na qual os pode executar.

Utilize uma StepSequence ao inicializar um pipeline para criar um fluxo de trabalho que contém passos a executar por uma ordem específica.

Inicializar StepSequence.

TrainingOutput

Define uma saída especializada de determinados PipelineSteps para utilização num pipeline.

TrainingOutput permite que uma métrica ou modelo de machine learning automatizado seja disponibilizado como uma saída de passo para ser consumida por outro passo num Pipeline do Azure Machine Learning. Pode ser utilizado com AutoMLStep ou HyperDriveStep.

Inicializar TrainingOutput.

param model_file: o ficheiro de modelo específico a incluir na saída. Apenas para HyperDriveStep .

Enumerações

TimeZone

Enumera os fusos horários válidos para uma periodicidade Schedule.