Delen via


TextNerJob Klas

Configuratie voor AutoML-tekst-NER-taak.

Initialiseert een nieuwe AutoML-tekst-NER-taak.

Overname
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextNerJob

Constructor

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parameters

training_data
Vereist

Trainingsgegevens die moeten worden gebruikt voor training

validation_data
Vereist

Validatiegegevens die moeten worden gebruikt voor het evalueren van het getrainde model

primary_metric
Vereist

Het primaire metrische gegeven dat moet worden weergegeven.

log_verbosity
Vereist

Uitgebreidheidsniveau logboek

kwargs
Vereist

Taakspecifieke argumenten

Methoden

dump

Dumpt de taakinhoud in een bestand in YAML-indeling.

extend_search_space

Voeg (a) zoekruimte(s) toe voor deze AutoML NLP-taak.

set_data
set_featurization
set_limits
set_sweep

Sweep-instellingen voor alle AutoML NLP-taken.

set_training_parameters

Bepaalde trainingsparameters tijdens de trainingsprocedure voor alle kandidaten corrigeren.

Pass. Dit moet een positief geheel getal zijn. :keyword learning_rate: initiële leersnelheid. Moet een float in (0, 1) zijn. :keyword learning_rate_scheduler: het type leerfrequentieplanner. Moet kiezen uit 'lineair', 'cosinus', 'cosine_with_restarts', 'polynoom', 'constant' en 'constant_with_warmup'. :keyword model_name: de modelnaam die tijdens de training moet worden gebruikt. Moet kiezen uit 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased en "xlnet-large-cased". :keyword number_of_epochs: het aantal tijdvakken om mee te trainen. Moet een positief geheel getal zijn. :keyword training_batch_size: de batchgrootte tijdens de training. Moet een positief geheel getal zijn. :keyword validation_batch_size: de batchgrootte tijdens de validatie. Moet een positief geheel getal zijn. :keyword warmup_ratio: verhouding van het totale aantal trainingsstappen dat wordt gebruikt voor een lineaire warming-up van 0 tot learning_rate. Moet een float in [0, 1] zijn. :keyword weight_decay: waarde van gewichtsverval wanneer optimizer sgd, adam of adamw is. Dit moet een float in het bereik [0, 1] zijn. :return: None.

dump

Dumpt de taakinhoud in een bestand in YAML-indeling.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parameters

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Vereist

Het lokale pad of de bestandsstroom waar de YAML-inhoud naar moet worden geschreven. Als dest een bestandspad is, wordt er een nieuw bestand gemaakt. Als dest een geopend bestand is, wordt het bestand rechtstreeks naar geschreven.

kwargs
dict

Aanvullende argumenten die moeten worden doorgegeven aan de YAML-serializer.

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

extend_search_space

Voeg (a) zoekruimte(s) toe voor deze AutoML NLP-taak.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parameters

value
Union[SearchSpace, List[SearchSpace]]
Vereist

een SearchSpace-object of een lijst met SearchSpace-objecten met nlp-specifieke parameters.

Retouren

Geen.

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

set_sweep

Sweep-instellingen voor alle AutoML NLP-taken.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parameters

sampling_algorithm

Vereist. Hiermee geeft u het type algoritme voor hyperparametersampling op. Mogelijke waarden zijn: 'Grid', 'Random' en 'Bayesian'.

early_termination

Optioneel beleid voor vroegtijdige beëindiging om slecht presterende trainingskandidaten te beëindigen.

Retouren

Geen

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

set_training_parameters

Bepaalde trainingsparameters tijdens de trainingsprocedure voor alle kandidaten corrigeren.

Pass. Dit moet een positief geheel getal zijn. :keyword learning_rate: initiële leersnelheid. Moet een float in (0, 1) zijn. :keyword learning_rate_scheduler: het type leerfrequentieplanner. Moet kiezen uit 'lineair', 'cosinus', 'cosine_with_restarts', 'polynoom', 'constant' en 'constant_with_warmup'. :keyword model_name: de modelnaam die tijdens de training moet worden gebruikt. Moet kiezen uit 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased en "xlnet-large-cased". :keyword number_of_epochs: het aantal tijdvakken om mee te trainen. Moet een positief geheel getal zijn. :keyword training_batch_size: de batchgrootte tijdens de training. Moet een positief geheel getal zijn. :keyword validation_batch_size: de batchgrootte tijdens de validatie. Moet een positief geheel getal zijn. :keyword warmup_ratio: verhouding van het totale aantal trainingsstappen dat wordt gebruikt voor een lineaire warming-up van 0 tot learning_rate. Moet een float in [0, 1] zijn. :keyword weight_decay: waarde van gewichtsverval wanneer optimizer sgd, adam of adamw is. Dit moet een float in het bereik [0, 1] zijn. :return: None.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parameters

gradient_accumulation_steps

aantal stappen waarover kleurovergangen moeten worden verzameld vóór een achterwaartse

Uitzonderingen

Gegenereerd als dest een bestandspad is en het bestand al bestaat.

Gegenereerd als dest een geopend bestand is en het bestand niet beschrijfbaar is.

Kenmerken

base_path

Het basispad van de resource.

Retouren

Het basispad van de resource.

Retourtype

str

creation_context

De context voor het maken van de resource.

Retouren

De metagegevens voor het maken van de resource.

Retourtype

featurization

id

De resource-id.

Retouren

De globale id van de resource, een ARM-id (Azure Resource Manager).

Retourtype

inputs

limits

log_files

Taakuitvoerbestanden.

Retouren

De woordenlijst met logboeknamen en URL's.

Retourtype

log_verbosity

outputs

primary_metric

search_space

status

De status van de taak.

Veelvoorkomende geretourneerde waarden zijn 'Wordt uitgevoerd', 'Voltooid' en 'Mislukt'. Alle mogelijke waarden zijn:

  • NotStarted: dit is een tijdelijke status waarin Run-objecten aan de clientzijde zich bevinden voordat ze in de cloud worden verzonden.

  • Starten: de uitvoering wordt verwerkt in de cloud. De aanroeper heeft op dit moment een uitvoerings-id.

  • Inrichten: er wordt rekenproces op aanvraag gemaakt voor een bepaalde taakverzending.

  • Voorbereiden: de uitvoeringsomgeving wordt voorbereid en bevindt zich in een van de volgende twee fasen:

    • Build van Docker-installatiekopieën

    • conda-omgeving instellen

  • In wachtrij: de taak wordt in de wachtrij geplaatst op het rekendoel. In BatchAI bevindt de taak zich bijvoorbeeld in een wachtrijstatus

    terwijl u wacht tot alle aangevraagde knooppunten gereed zijn.

  • Uitvoeren: de taak wordt uitgevoerd op het rekendoel.

  • Voltooien: de uitvoering van de gebruikerscode is voltooid en de uitvoering bevindt zich in de naverwerkingsfasen.

  • CancelRequested: annulering is aangevraagd voor de taak.

  • Voltooid: de uitvoering is voltooid. Dit omvat zowel de uitvoering van de gebruikerscode als de uitvoering

    naverwerkingsfasen.

  • Mislukt: de uitvoering is mislukt. Meestal geeft de eigenschap Error bij een uitvoering details over de reden.

  • Geannuleerd: volgt een annuleringsaanvraag en geeft aan dat de uitvoering nu is geannuleerd.

  • Reageert niet: voor uitvoeringen waarvoor Heartbeats is ingeschakeld, is er onlangs geen heartbeat verzonden.

Retouren

Status van de taak.

Retourtype

studio_url

Azure ML Studio-eindpunt.

Retouren

De URL naar de pagina met taakgegevens.

Retourtype

sweep

task_type

Taaktype ophalen.

Retouren

Het type taak dat moet worden uitgevoerd. Mogelijke waarden zijn: 'classificatie', 'regressie', 'voorspellen'.

Retourtype

str

test_data

Testgegevens ophalen.

Retouren

Invoer van gegevens testen

Retourtype

training_data

Trainingsgegevens ophalen.

Retouren

Invoer van trainingsgegevens

Retourtype

training_parameters

type

Het type taak.

Retouren

Het type taak.

Retourtype

validation_data

Validatiegegevens ophalen.

Retouren

Invoer van validatiegegevens

Retourtype