BanditPolicy Classe
Define uma política de encerramento antecipado com base nos critérios de margem de atraso e uma frequência e um intervalo de atraso para avaliação.
Inicialize um BanditPolicy com o fator slack, slack_amount e intervalo de avaliação.
- Herança
-
azureml.train.hyperdrive.policy.EarlyTerminationPolicyBanditPolicy
Construtor
BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)
Parâmetros
Nome | Description |
---|---|
slack_factor
|
A taxa usada para calcular a distância permitida da execução de experimento de melhor desempenho. Valor padrão: None
|
slack_amount
|
A distância absoluta permitida da execução de melhor desempenho. Valor padrão: None
|
evaluation_interval
|
A frequência para aplicar a política. Valor padrão: 1
|
delay_evaluation
|
O número de intervalos para os quais atrasar a primeira avaliação de política.
Se for especificado, a política se aplicará a cada múltiplo de Valor padrão: 0
|
slack_factor
Obrigatório
|
A taxa usada para calcular a distância permitida da execução de experimento de melhor desempenho. |
slack_amount
Obrigatório
|
A distância absoluta permitida da execução de melhor desempenho. |
evaluation_interval
Obrigatório
|
A frequência para aplicar a política. |
delay_evaluation
Obrigatório
|
O número de intervalos para os quais atrasar a primeira avaliação de política.
Se for especificado, a política se aplicará a cada múltiplo de |
Comentários
A política do Bandit usa os seguintes parâmetros de configuração:
slack_factor
: o valor de margem de atraso permitida em relação à execução de treinamento de melhor desempenho. Esse fator especifica a margem de atraso como uma proporção.slack_amount
: o valor de margem de atraso permitida em relação à execução de treinamento de melhor desempenho. Esse fator especifica a margem de atraso como um valor absoluto.evaluation_interval
: Opcional. A frequência para aplicar a política. Cada vez que o script de treinamento registra em log a métrica primária conta como um intervalo.delay_evaluation
: Opcional. O número de intervalos para atrasar a avaliação da política. Use esse parâmetro para evitar o encerramento prematuro de execuções de treinamento. Se for especificado, a política se aplicará a cada múltiplo deevaluation_interval
maior que ou igual adelay_evaluation
.
Qualquer execução que não se enquadrar no fator de margem de atraso ou no valor da margem de atraso da métrica de avaliação em relação à execução de melhor desempenho será encerrada.
Considere uma política de Bandit com slack_factor
= 0.2 e evaluation_interval
= 100.
Suponha que a execução X seja a execução de melhor desempenho no momento com uma AUC (métrica de desempenho) de 0,8 após 100 intervalos. Além disso, suponha que a melhor AUC relatada para uma execução seja Y. Essa política compara o valor (Y + Y * 0,2) a 0,8 e, se for menor, cancela a execução. Se delay_evaluation
= 200, a primeira vez que a política será aplicada será no intervalo 200.
Considere uma política de Bandit com slack_amount
= 0.2 e evaluation_interval
= 100.
Se a execução 3 for a melhor execução atualmente com um AUC (métrica de desempenho) de 0,8 após 100 intervalos, qualquer execução com um AUC menor que 0,6 (0,8 – 0,2) depois de 100 iterações será encerrada.
Da mesma forma, o delay_evaluation
também pode ser usado para atrasar a primeira avaliação da política de encerramento para um número específico de sequências.
Para obter mais informações sobre como aplicar políticas de encerramento antecipado, confira Ajustar hiperparâmetros para seu modelo.
Atributos
delay_evaluation
Retorna o número de sequências para o qual a primeira avaliação é atrasada.
Retornos
Tipo | Description |
---|---|
A avaliação do atraso. |
evaluation_interval
slack_factor
Retorna o fator de margem de atraso permitida em relação à execução de treinamento de melhor desempenho.
Retornos
Tipo | Description |
---|---|
O fator de margem de atraso. |
POLICY_NAME
POLICY_NAME = 'Bandit'