TextClassificationMultilabelJob Clase
Configuración del trabajo Multilabel de clasificación de texto autoML.
Inicializa una nueva tarea Multilabel de clasificación de texto AutoML.
- Herencia
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationMultilabelJob
Constructor
TextClassificationMultilabelJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parámetros
- target_column_name
Nombre de la columna de destino
- training_data
Datos de entrenamiento que se usarán para el entrenamiento
- validation_data
Datos de validación que se usarán para evaluar el modelo entrenado
- primary_metric
Métrica principal que se va a mostrar.
- log_verbosity
Nivel de detalle del registro
- kwargs
Argumentos específicos del trabajo
Métodos
dump |
Volca el contenido del trabajo en un archivo en formato YAML. |
extend_search_space |
Agregue (a) espacios de búsqueda para este trabajo de NLP de AutoML. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Configuración de barrido para todas las tareas de NLP de AutoML. |
set_training_parameters |
Corrija ciertos parámetros de entrenamiento a lo largo del procedimiento de entrenamiento para todos los candidatos. Pasar. Debe ser un entero positivo. :keyword learning_rate: velocidad de aprendizaje inicial. Debe ser un valor float en (0, 1). :keyword learning_rate_scheduler: el tipo de programador de velocidad de aprendizaje. Debe elegir entre 'lineal', 'coseno', 'cosine_with_restarts', 'polinomial', 'constant' y 'constant_with_warmup'. :keyword model_name: el nombre del modelo que se va a usar durante el entrenamiento. Debe elegir entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingü-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' y 'xlnet-large-cased'. :keyword number_of_epochs: el número de épocas con las que entrenar. Debe ser un entero positivo. :keyword training_batch_size: el tamaño del lote durante el entrenamiento. Debe ser un entero positivo. :keyword validation_batch_size: el tamaño del lote durante la validación. Debe ser un entero positivo. :keyword warmup_ratio: proporción de los pasos de entrenamiento totales usados para un calentamiento lineal de 0 a learning_rate. Debe ser un valor float en [0, 1]. :palabra clave weight_decay: valor de descomposición del peso cuando el optimizador es sgd, adam o adamw. Debe ser un float en el intervalo [0, 1]. :return: None. |
dump
Volca el contenido del trabajo en un archivo en formato YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parámetros
Ruta de acceso local o secuencia de archivos en la que se va a escribir el contenido de YAML. Si dest es una ruta de acceso de archivo, se creará un nuevo archivo. Si dest es un archivo abierto, el archivo se escribirá directamente.
- kwargs
- dict
Argumentos adicionales para pasar al serializador YAML.
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
extend_search_space
Agregue (a) espacios de búsqueda para este trabajo de NLP de AutoML.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parámetros
- value
- Union[SearchSpace, List[SearchSpace]]
un objeto SearchSpace o una lista de objetos SearchSpace con parámetros específicos de nlp.
Devoluciones
Ninguno.
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
set_sweep
Configuración de barrido para todas las tareas de NLP de AutoML.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parámetros
- sampling_algorithm
Necesario. Especifica el tipo de algoritmo de muestreo de hiperparámetros. Entre los valores posibles se incluyen: "Grid", "Random" y "Bayesian".
- early_termination
Directiva de terminación anticipada opcional para terminar con candidatos de entrenamiento con un rendimiento deficiente.
Devoluciones
Ninguno
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
set_training_parameters
Corrija ciertos parámetros de entrenamiento a lo largo del procedimiento de entrenamiento para todos los candidatos.
Pasar. Debe ser un entero positivo. :keyword learning_rate: velocidad de aprendizaje inicial. Debe ser un valor float en (0, 1). :keyword learning_rate_scheduler: el tipo de programador de velocidad de aprendizaje. Debe elegir entre 'lineal', 'coseno', 'cosine_with_restarts', 'polinomial', 'constant' y 'constant_with_warmup'. :keyword model_name: el nombre del modelo que se va a usar durante el entrenamiento. Debe elegir entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingü-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' y 'xlnet-large-cased'. :keyword number_of_epochs: el número de épocas con las que entrenar. Debe ser un entero positivo. :keyword training_batch_size: el tamaño del lote durante el entrenamiento. Debe ser un entero positivo. :keyword validation_batch_size: el tamaño del lote durante la validación. Debe ser un entero positivo. :keyword warmup_ratio: proporción de los pasos de entrenamiento totales usados para un calentamiento lineal de 0 a learning_rate. Debe ser un valor float en [0, 1]. :palabra clave weight_decay: valor de descomposición del peso cuando el optimizador es sgd, adam o adamw. Debe ser un float en el intervalo [0, 1]. :return: None.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parámetros
- gradient_accumulation_steps
número de pasos sobre los que se van a acumular degradados antes de un retroceso
Excepciones
Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.
Se genera si dest es un archivo abierto y el archivo no se puede escribir.
Atributos
base_path
Ruta de acceso base del recurso.
Devoluciones
Ruta de acceso base del recurso.
Tipo de valor devuelto
creation_context
Contexto de creación del recurso.
Devoluciones
Metadatos de creación del recurso.
Tipo de valor devuelto
featurization
id
El identificador del recurso.
Devoluciones
Identificador global del recurso, un identificador de Azure Resource Manager (ARM).
Tipo de valor devuelto
inputs
limits
log_files
Archivos de salida del trabajo.
Devoluciones
Diccionario de nombres de registro y direcciones URL.
Tipo de valor devuelto
log_verbosity
outputs
primary_metric
search_space
status
El estado del trabajo.
Los valores comunes devueltos incluyen "Running", "Completed" y "Failed". Todos los valores posibles son:
NotStarted: se trata de un estado temporal en el que se encuentran los objetos Run del lado cliente antes del envío en la nube.
Starting: la ejecución ha empezado a procesarse en la nube. El autor de la llamada tiene un identificador de ejecución en este momento.
Aprovisionamiento: el proceso a petición se está creando para un envío de trabajo determinado.
Preparación: el entorno de ejecución se está preparando y se encuentra en una de estas dos fases:
Compilación de imágenes de Docker
configuración del entorno Conda
En cola: el trabajo se pone en cola en el destino de proceso. Por ejemplo, en BatchAI, el trabajo está en estado en cola.
mientras espera a que todos los nodos solicitados estén listos.
En ejecución: el trabajo se ha iniciado para ejecutarse en el destino de proceso.
Finalización: la ejecución del código de usuario se ha completado y la ejecución está en fases posteriores al procesamiento.
CancelRequested: se ha solicitado la cancelación del trabajo.
Completado: la ejecución se ha completado correctamente. Esto incluye tanto la ejecución del código de usuario como la ejecución
posteriores al procesamiento de la ejecución.
Failed: error en la ejecución. Normalmente, la propiedad Error de una ejecución proporcionará detalles sobre por qué se produjo el error.
Canceled: sigue a una solicitud de cancelación e indica que la ejecución se ha cancelado correctamente.
NotResponding: en el caso de las ejecuciones que tienen los latidos habilitados, no se ha enviado recientemente ningún latido.
Devoluciones
Estado del trabajo.
Tipo de valor devuelto
studio_url
Punto de conexión de Azure ML Studio.
Devoluciones
Dirección URL de la página de detalles del trabajo.
Tipo de valor devuelto
sweep
task_type
Obtiene el tipo de tarea.
Devoluciones
Tipo de tarea que se va a ejecutar. Entre los valores posibles se incluyen: "classification", "regression", "forecasting".
Tipo de valor devuelto
test_data
training_data
Obtener datos de entrenamiento.
Devoluciones
Entrada de datos de entrenamiento
Tipo de valor devuelto
training_parameters
type
validation_data
Obtener datos de validación.
Devoluciones
Entrada de datos de validación
Tipo de valor devuelto
Azure SDK for Python