Compartilhar via


ParallelComponent Classe

Versão paralela do componente, usada para definir um componente paralelo.

Herança
azure.ai.ml.entities._component.component.Component
ParallelComponent
azure.ai.ml.entities._job.parallel.parameterized_parallel.ParameterizedParallel
ParallelComponent
azure.ai.ml.entities._component.code.ComponentCodeMixin
ParallelComponent

Construtor

ParallelComponent(*, name: str | None = None, version: str | None = None, description: str | None = None, tags: Dict[str, Any] | None = None, display_name: str | None = None, retry_settings: RetrySettings | None = None, logging_level: str | None = None, max_concurrency_per_instance: int | None = None, error_threshold: int | None = None, mini_batch_error_threshold: int | None = None, task: ParallelTask | None = None, mini_batch_size: str | None = None, partition_keys: List | None = None, input_data: str | None = None, resources: JobResourceConfiguration | None = None, inputs: Dict | None = None, outputs: Dict | None = None, code: str | None = None, instance_count: int | None = None, is_deterministic: bool = True, **kwargs: Any)

Parâmetros

Nome Description
name
Obrigatório
str

Nome do componente. O padrão é Nenhum

version
Obrigatório
str

A versão do componente. O padrão é Nenhum

description
Obrigatório
str

Descrição do componente. O padrão é Nenhum

tags
Obrigatório

Dicionário de marcas. As marcas podem ser adicionadas, removidas e atualizadas. O padrão é Nenhum

display_name
Obrigatório
str

Nome de exibição do componente. O padrão é Nenhum

retry_settings
Obrigatório

falha na repetição da execução do componente paralelo. O padrão é Nenhum

logging_level
Obrigatório
str

Uma cadeia de caracteres do nome do nível de registro em log. O padrão é Nenhum

max_concurrency_per_instance
Obrigatório
int

O paralelismo máximo que cada instância de computação tem. O padrão é Nenhum

error_threshold
Obrigatório
int

O número de falhas de processamento de item deve ser ignorado. O padrão é Nenhum

mini_batch_error_threshold
Obrigatório
int

O número de falhas de processamento de minilote deve ser ignorado. O padrão é Nenhum

task
Obrigatório

A tarefa paralela. O padrão é Nenhum

mini_batch_size
Obrigatório
str

Para entrada FileDataset, esse campo é o número de arquivos que um script do usuário pode processar em uma chamada run(). Para entrada TabularDataset, esse campo é o tamanho aproximado dos dados que o script do usuário pode processar em uma chamada run(). Os valores de exemplo são 1024, 1024 KB, 10 MB e 1 GB. (opcional, o valor padrão é 10 arquivos para FileDataset e 1MB para TabularDataset.) Esse valor pode ser definido por meio de PipelineParameter.

partition_keys
Obrigatório

As chaves usadas para particionar o conjuntos de dados em minilotes. O padrão é Nenhum Se especificado, os dados com a mesma chave serão particionados no mesmo minilote. Se partition_keys e mini_batch_size forem especificados, partition_keys entrará em vigor. As entradas devem ser conjuntos de dados particionados e o partition_keys deve ser um subconjunto das chaves de cada conjunto de dados de entrada para que isso funcione.

input_data
Obrigatório
str

Os dados de entrada. O padrão é Nenhum

resources
Obrigatório

Configuração de recursos de computação para o componente. O padrão é Nenhum

inputs
Obrigatório

Entradas do componente. O padrão é Nenhum

outputs
Obrigatório

Saídas do componente. O padrão é Nenhum

code
Obrigatório
str

propriedade promovida de task.code

instance_count
Obrigatório
int

propriedade promovida de resources.instance_count. O padrão é Nenhum

is_deterministic
Obrigatório

Se o componente paralelo é determinístico. O padrão é True

Parâmetros de apenas palavra-chave

Nome Description
name
Obrigatório
version
Obrigatório
description
Obrigatório
tags
Obrigatório
display_name
Obrigatório
retry_settings
Obrigatório
logging_level
Obrigatório
max_concurrency_per_instance
Obrigatório
error_threshold
Obrigatório
mini_batch_error_threshold
Obrigatório
task
Obrigatório
mini_batch_size
Obrigatório
partition_keys
Obrigatório
input_data
Obrigatório
resources
Obrigatório
inputs
Obrigatório
outputs
Obrigatório
code
Obrigatório
instance_count
Obrigatório
is_deterministic
valor padrão: True

Métodos

dump

Despejar o conteúdo do componente em um arquivo no formato yaml.

dump

Despejar o conteúdo do componente em um arquivo no formato yaml.

dump(dest: str | PathLike | IO, **kwargs: Any) -> None

Parâmetros

Nome Description
dest
Obrigatório
Union[<xref:PathLike>, str, IO[AnyStr]]

O destino para receber o conteúdo desse componente. Deve ser um caminho para um arquivo local ou um fluxo de arquivos já aberto. Se dest for um caminho de arquivo, um novo arquivo será criado e uma exceção será gerada se o arquivo existir. Se dest for um arquivo aberto, o arquivo será gravado diretamente e uma exceção será gerada se o arquivo não for gravável.

Atributos

base_path

O caminho base do recurso.

Retornos

Tipo Description
str

O caminho base do recurso.

code

Valor retornado de propriedade promovida task.code, que é um caminho local ou remoto que aponta para o código-fonte.

Retornos

Tipo Description

Valor de task.code.

creation_context

O contexto de criação do recurso.

Retornos

Tipo Description

Os metadados de criação para o recurso.

display_name

Nome de exibição do componente.

Retornos

Tipo Description
str

Nome de exibição do componente.

environment

O valor retornado de promoted property task.environment indica o ambiente no qual o trabalho de treinamento será executado.

Retornos

Tipo Description

Valor de task.environment.

id

A ID do recurso.

Retornos

Tipo Description

A ID global do recurso, uma ID do ARM (Resource Manager do Azure).

inputs

Entradas do componente.

Retornos

Tipo Description

Entradas do componente.

instance_count

Valor retornado da propriedade promovida resources.instance_count.

Retornos

Tipo Description

Valor de resources.instance_count.

is_deterministic

Se o componente é determinístico.

Retornos

Tipo Description

Se o componente é determinístico

outputs

Saídas do componente.

Retornos

Tipo Description

Saídas do componente.

resources

retry_settings

task

type

Tipo do componente, o padrão é 'command'.

Retornos

Tipo Description
str

Tipo do componente.

version

A versão do componente.

Retornos

Tipo Description
str

A versão do componente.