BanditPolicy Třída
Definuje zásady předčasného ukončení založené na kritériích časové rezervy a frekvenci a interval zpoždění pro vyhodnocení.
Inicializujte zásadu BanditPolicy pomocí faktoru slacku, slack_amount a intervalu vyhodnocení.
- Dědičnost
-
azureml.train.hyperdrive.policy.EarlyTerminationPolicyBanditPolicy
Konstruktor
BanditPolicy(evaluation_interval=1, slack_factor=None, slack_amount=None, delay_evaluation=0)
Parametry
Name | Description |
---|---|
slack_factor
|
Poměr použitý k výpočtu povolené vzdálenosti od spuštění experimentu s nejlepším výkonem. Default value: None
|
slack_amount
|
Absolutní povolená vzdálenost od nejvýkonnějšího běhu Default value: None
|
evaluation_interval
|
Četnost použití zásad. Default value: 1
|
delay_evaluation
|
Počet intervalů, pro které se má zpozdit první vyhodnocení zásad.
Pokud je zadaný, zásada použije každý násobek Default value: 0
|
slack_factor
Vyžadováno
|
Poměr použitý k výpočtu povolené vzdálenosti od spuštění experimentu s nejlepším výkonem. |
slack_amount
Vyžadováno
|
Absolutní povolená vzdálenost od nejvýkonnějšího běhu |
evaluation_interval
Vyžadováno
|
Četnost použití zásad. |
delay_evaluation
Vyžadováno
|
Počet intervalů, pro které se má zpozdit první vyhodnocení zásad.
Pokud je zadaný, zásada použije každý násobek |
Poznámky
Zásady Bandit mají následující parametry konfigurace:
slack_factor
: Povolená časová rezerva s ohledem na trénovací běh s nejlepším výkonem. Tento faktor určuje časovou rezervu jako poměr.slack_amount
: Povolená časová rezerva s ohledem na trénovací běh s nejlepším výkonem. Tento faktor určuje časovou rezervu jako absolutní částku.evaluation_interval
:Volitelné. Četnost použití zásad. Pokaždé, když trénovací skript protokoluje, se primární metrika počítá jako jeden interval.delay_evaluation
:Volitelné. Počet intervalů zpoždění vyhodnocení zásad Tento parametr použijte, pokud chcete zabránit předčasnému ukončení trénovacích běhů. Pokud je zadaný, zásada použije každý násobekevaluation_interval
, který je větší nebo roven hodnotědelay_evaluation
.
Všechna spuštění, která nespadají do faktoru časové rezervy nebo časové rezervy metriky vyhodnocení s ohledem na spuštění s nejlepším výkonem, budou ukončena.
Představte si zásadu Bandit s slack_factor
= 0,2 a evaluation_interval
= 100.
Předpokládejme, že spuštění X je aktuálně nejvýkonnější spuštění s metrikou AUC (metrika výkonu) 0,8 po 100 intervalech. Dále předpokládejme, že nejlepší AUC hlášená pro spuštění je Y. Tato zásada porovná hodnotu (Y + Y × 0,2) s hodnotou 0,8, a pokud je menší, zruší spuštění. Pokud delay_evaluation
= 200, použije se zásada poprvé v intervalu 200.
Teď zvažte zásadu Bandit s slack_amount
= 0,2 a evaluation_interval
= 100.
Pokud je spuštění 3 aktuálně nejvýkonnější spuštění s AUC (metrikou výkonu) 0,8 po 100 intervalech, pak se všechna spuštění s AUC nižší než 0,6 (0,8 až 0,2) po 100 iteracích ukončí.
Podobně delay_evaluation
lze použít také ke zpoždění vyhodnocení zásad prvního ukončení pro určitý počet sekvencí.
Další informace o použití zásad předčasného ukončení najdete v tématu Ladění hyperparametrů pro váš model.
Atributy
delay_evaluation
Vrátí počet sekvencí, u kterých je první vyhodnocení zpožděné.
Návraty
Typ | Description |
---|---|
Vyhodnocení zpoždění. |
evaluation_interval
slack_factor
Vrátí faktor časové rezervy s ohledem na nejvýkonnější trénovací běh.
Návraty
Typ | Description |
---|---|
Faktor časové rezervy. |
POLICY_NAME
POLICY_NAME = 'Bandit'