TextNerJob Klas
Configuratie voor AutoML-tekst-NER-taak.
Initialiseert een nieuwe AutoML-tekst-NER-taak.
- Overname
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextNerJob
Constructor
TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parameters
- training_data
Trainingsgegevens die moeten worden gebruikt voor training
- validation_data
Validatiegegevens die moeten worden gebruikt voor het evalueren van het getrainde model
- primary_metric
Het primaire metrische gegeven dat moet worden weergegeven.
- log_verbosity
Uitgebreidheidsniveau logboek
- kwargs
Taakspecifieke argumenten
Methoden
dump |
Dumpt de taakinhoud in een bestand in YAML-indeling. |
extend_search_space |
Voeg (a) zoekruimte(s) toe voor deze AutoML NLP-taak. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Sweep-instellingen voor alle AutoML NLP-taken. |
set_training_parameters |
Bepaalde trainingsparameters tijdens de trainingsprocedure voor alle kandidaten corrigeren. Pass. Dit moet een positief geheel getal zijn. :keyword learning_rate: initiële leersnelheid. Moet een float in (0, 1) zijn. :keyword learning_rate_scheduler: het type leerfrequentieplanner. Moet kiezen uit 'lineair', 'cosinus', 'cosine_with_restarts', 'polynoom', 'constant' en 'constant_with_warmup'. :keyword model_name: de modelnaam die tijdens de training moet worden gebruikt. Moet kiezen uit 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased en "xlnet-large-cased". :keyword number_of_epochs: het aantal tijdvakken om mee te trainen. Moet een positief geheel getal zijn. :keyword training_batch_size: de batchgrootte tijdens de training. Moet een positief geheel getal zijn. :keyword validation_batch_size: de batchgrootte tijdens de validatie. Moet een positief geheel getal zijn. :keyword warmup_ratio: verhouding van het totale aantal trainingsstappen dat wordt gebruikt voor een lineaire warming-up van 0 tot learning_rate. Moet een float in [0, 1] zijn. :keyword weight_decay: waarde van gewichtsverval wanneer optimizer sgd, adam of adamw is. Dit moet een float in het bereik [0, 1] zijn. :return: None. |
dump
Dumpt de taakinhoud in een bestand in YAML-indeling.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parameters
Het lokale pad of de bestandsstroom waar de YAML-inhoud naar moet worden geschreven. Als dest een bestandspad is, wordt er een nieuw bestand gemaakt. Als dest een geopend bestand is, wordt het bestand rechtstreeks naar geschreven.
- kwargs
- dict
Aanvullende argumenten die moeten worden doorgegeven aan de YAML-serializer.
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
extend_search_space
Voeg (a) zoekruimte(s) toe voor deze AutoML NLP-taak.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parameters
- value
- Union[SearchSpace, List[SearchSpace]]
een SearchSpace-object of een lijst met SearchSpace-objecten met nlp-specifieke parameters.
Retouren
Geen.
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
set_sweep
Sweep-instellingen voor alle AutoML NLP-taken.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parameters
- sampling_algorithm
Vereist. Hiermee geeft u het type algoritme voor hyperparametersampling op. Mogelijke waarden zijn: 'Grid', 'Random' en 'Bayesian'.
- early_termination
Optioneel beleid voor vroegtijdige beëindiging om slecht presterende trainingskandidaten te beëindigen.
Retouren
Geen
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
set_training_parameters
Bepaalde trainingsparameters tijdens de trainingsprocedure voor alle kandidaten corrigeren.
Pass. Dit moet een positief geheel getal zijn. :keyword learning_rate: initiële leersnelheid. Moet een float in (0, 1) zijn. :keyword learning_rate_scheduler: het type leerfrequentieplanner. Moet kiezen uit 'lineair', 'cosinus', 'cosine_with_restarts', 'polynoom', 'constant' en 'constant_with_warmup'. :keyword model_name: de modelnaam die tijdens de training moet worden gebruikt. Moet kiezen uit 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased en "xlnet-large-cased". :keyword number_of_epochs: het aantal tijdvakken om mee te trainen. Moet een positief geheel getal zijn. :keyword training_batch_size: de batchgrootte tijdens de training. Moet een positief geheel getal zijn. :keyword validation_batch_size: de batchgrootte tijdens de validatie. Moet een positief geheel getal zijn. :keyword warmup_ratio: verhouding van het totale aantal trainingsstappen dat wordt gebruikt voor een lineaire warming-up van 0 tot learning_rate. Moet een float in [0, 1] zijn. :keyword weight_decay: waarde van gewichtsverval wanneer optimizer sgd, adam of adamw is. Dit moet een float in het bereik [0, 1] zijn. :return: None.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parameters
- gradient_accumulation_steps
aantal stappen waarover kleurovergangen moeten worden verzameld vóór een achterwaartse
Uitzonderingen
Gegenereerd als dest een bestandspad is en het bestand al bestaat.
Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.
Kenmerken
base_path
creation_context
De context voor het maken van de resource.
Retouren
De metagegevens voor het maken van de resource.
Retourtype
featurization
id
De resource-id.
Retouren
De globale id van de resource, een ARM-id (Azure Resource Manager).
Retourtype
inputs
limits
log_files
Taakuitvoerbestanden.
Retouren
De woordenlijst met logboeknamen en URL's.
Retourtype
log_verbosity
outputs
primary_metric
search_space
status
De status van de taak.
Veelvoorkomende geretourneerde waarden zijn 'Wordt uitgevoerd', 'Voltooid' en 'Mislukt'. Alle mogelijke waarden zijn:
NotStarted: dit is een tijdelijke status waarin Run-objecten aan de clientzijde zich bevinden voordat ze in de cloud worden verzonden.
Starten: de uitvoering wordt verwerkt in de cloud. De aanroeper heeft op dit moment een uitvoerings-id.
Inrichten: er wordt rekenproces op aanvraag gemaakt voor een bepaalde taakverzending.
Voorbereiden: de uitvoeringsomgeving wordt voorbereid en bevindt zich in een van de volgende twee fasen:
Build van Docker-installatiekopieën
conda-omgeving instellen
In wachtrij: de taak wordt in de wachtrij geplaatst op het rekendoel. In BatchAI bevindt de taak zich bijvoorbeeld in een wachtrijstatus
terwijl u wacht tot alle aangevraagde knooppunten gereed zijn.
Uitvoeren: de taak wordt uitgevoerd op het rekendoel.
Voltooien: de uitvoering van de gebruikerscode is voltooid en de uitvoering bevindt zich in de naverwerkingsfasen.
CancelRequested: annulering is aangevraagd voor de taak.
Voltooid: de uitvoering is voltooid. Dit omvat zowel de uitvoering van de gebruikerscode als de uitvoering
naverwerkingsfasen.
Mislukt: de uitvoering is mislukt. Meestal geeft de eigenschap Error bij een uitvoering details over de reden.
Geannuleerd: volgt een annuleringsaanvraag en geeft aan dat de uitvoering nu is geannuleerd.
Reageert niet: voor uitvoeringen waarvoor Heartbeats is ingeschakeld, is er onlangs geen heartbeat verzonden.
Retouren
Status van de taak.
Retourtype
studio_url
sweep
task_type
Taaktype ophalen.
Retouren
Het type taak dat moet worden uitgevoerd. Mogelijke waarden zijn: 'classificatie', 'regressie', 'voorspellen'.
Retourtype
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python