Compartilhar via


BanditPolicy Classe

Define uma política de encerramento antecipado com base nos critérios de margem de atraso e uma frequência e um intervalo de atraso para avaliação.

Inicialize um BanditPolicy com o fator slack, slack_amount e intervalo de avaliação.

Herança
azureml.train.hyperdrive.policy.EarlyTerminationPolicy
BanditPolicy

Construtor

BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)

Parâmetros

Nome Description
slack_factor

A taxa usada para calcular a distância permitida da execução de experimento de melhor desempenho.

Valor padrão: None
slack_amount

A distância absoluta permitida da execução de melhor desempenho.

Valor padrão: None
evaluation_interval
int

A frequência para aplicar a política.

Valor padrão: 1
delay_evaluation
int

O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificado, a política se aplicará a cada múltiplo de evaluation_interval maior que ou igual a delay_evaluation.

Valor padrão: 0
slack_factor
Obrigatório

A taxa usada para calcular a distância permitida da execução de experimento de melhor desempenho.

slack_amount
Obrigatório

A distância absoluta permitida da execução de melhor desempenho.

evaluation_interval
Obrigatório
int

A frequência para aplicar a política.

delay_evaluation
Obrigatório
int

O número de intervalos para os quais atrasar a primeira avaliação de política. Se for especificado, a política se aplicará a cada múltiplo de evaluation_interval maior que ou igual a delay_evaluation.

Comentários

A política do Bandit usa os seguintes parâmetros de configuração:

  • slack_factor: o valor de margem de atraso permitida em relação à execução de treinamento de melhor desempenho. Esse fator especifica a margem de atraso como uma proporção.

  • slack_amount: o valor de margem de atraso permitida em relação à execução de treinamento de melhor desempenho. Esse fator especifica a margem de atraso como um valor absoluto.

  • evaluation_interval: Opcional. A frequência para aplicar a política. Cada vez que o script de treinamento registra em log a métrica primária conta como um intervalo.

  • delay_evaluation: Opcional. O número de intervalos para atrasar a avaliação da política. Use esse parâmetro para evitar o encerramento prematuro de execuções de treinamento. Se for especificado, a política se aplicará a cada múltiplo de evaluation_interval maior que ou igual a delay_evaluation.

Qualquer execução que não se enquadrar no fator de margem de atraso ou no valor da margem de atraso da métrica de avaliação em relação à execução de melhor desempenho será encerrada.

Considere uma política de Bandit com slack_factor = 0.2 e evaluation_interval = 100. Suponha que a execução X seja a execução de melhor desempenho no momento com uma AUC (métrica de desempenho) de 0,8 após 100 intervalos. Além disso, suponha que a melhor AUC relatada para uma execução seja Y. Essa política compara o valor (Y + Y * 0,2) a 0,8 e, se for menor, cancela a execução. Se delay_evaluation = 200, a primeira vez que a política será aplicada será no intervalo 200.

Considere uma política de Bandit com slack_amount = 0.2 e evaluation_interval = 100. Se a execução 3 for a melhor execução atualmente com um AUC (métrica de desempenho) de 0,8 após 100 intervalos, qualquer execução com um AUC menor que 0,6 (0,8 – 0,2) depois de 100 iterações será encerrada. Da mesma forma, o delay_evaluation também pode ser usado para atrasar a primeira avaliação da política de encerramento para um número específico de sequências.

Para obter mais informações sobre como aplicar políticas de encerramento antecipado, confira Ajustar hiperparâmetros para seu modelo.

Atributos

delay_evaluation

Retorna o número de sequências para o qual a primeira avaliação é atrasada.

Retornos

Tipo Description
int

A avaliação do atraso.

evaluation_interval

Retorna o valor do intervalo de avaliação.

Retornos

Tipo Description
int

O intervalo da avaliação.

slack_factor

Retorna o fator de margem de atraso permitida em relação à execução de treinamento de melhor desempenho.

Retornos

Tipo Description

O fator de margem de atraso.

POLICY_NAME

POLICY_NAME = 'Bandit'