TextClassificationMultilabelJob Класс
Конфигурация для задания классификации текста AutoML с несколькими меткими.
Инициализирует новую задачу классификации текста AutoML с несколькими метками.
- Наследование
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationMultilabelJob
Конструктор
TextClassificationMultilabelJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Параметры
- target_column_name
Имя целевого столбца
- training_data
Обучающие данные, используемые для обучения
- validation_data
Данные проверки, используемые для оценки обученной модели
- primary_metric
Основная отображаемая метрика.
- log_verbosity
Уровень детализации журнала
- kwargs
Аргументы, относящиеся к заданию
Методы
dump |
Создает дампы содержимого задания в файл в формате YAML. |
extend_search_space |
Добавьте (а) пространства поиска для этого задания NLP AutoML. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Параметры очистки для всех задач NLP AutoML. |
set_training_parameters |
Исправьте определенные параметры обучения на протяжении всей процедуры обучения для всех кандидатов. Пройти. Это должно быть положительное целое число. :ключевое слово learning_rate: начальная скорость обучения. Должен быть типом float in (0, 1). :ключевое слово learning_rate_scheduler: тип планировщика скорости обучения. Необходимо выбрать варианты "linear", "cosine", "cosine_with_restarts", "polynomial", "constant" и "constant_with_warmup". :ключевое слово model_name: имя модели, используемое во время обучения. Необходимо выбрать один из вариантов : "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased и 'xlnet-large-cased'. :ключевое слово number_of_epochs: количество эпох для обучения. Принимаются только положительные целые числа. :ключевое слово training_batch_size: размер пакета во время обучения. Принимаются только положительные целые числа. :ключевое слово validation_batch_size: размер пакета во время проверки. Принимаются только положительные целые числа. :ключевое слово warmup_ratio: отношение общего числа шагов обучения, используемых для линейной прогрева, от 0 до learning_rate. Должен быть float в [0, 1]. :ключевое слово weight_decay: значение затухания веса, если оптимизатор имеет значение sgd, adam или adamw. Это должно быть число с плавающей точкой в диапазоне [0, 1]. :return: нет. |
dump
Создает дампы содержимого задания в файл в формате YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Параметры
Локальный путь или файловый поток для записи содержимого YAML. Если dest — это путь к файлу, будет создан новый файл. Если dest является открытым файлом, файл будет записан напрямую.
- kwargs
- dict
Дополнительные аргументы для передачи в сериализатор YAML.
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
extend_search_space
Добавьте (а) пространства поиска для этого задания NLP AutoML.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Параметры
- value
- Union[SearchSpace, List[SearchSpace]]
либо объект SearchSpace, либо список объектов SearchSpace с параметрами, характерными для nlp.
Возвращаемое значение
Нет.
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
set_sweep
Параметры очистки для всех задач NLP AutoML.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Параметры
- sampling_algorithm
Обязательный. Указывает тип алгоритма выборки гиперпараметров. Возможные значения: "Grid", "Random" и "Bayesian".
- early_termination
Необязательная политика досрочного завершения для прекращения плохой работы кандидатов на обучение.
Возвращаемое значение
Нет
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
set_training_parameters
Исправьте определенные параметры обучения на протяжении всей процедуры обучения для всех кандидатов.
Пройти. Это должно быть положительное целое число. :ключевое слово learning_rate: начальная скорость обучения. Должен быть типом float in (0, 1). :ключевое слово learning_rate_scheduler: тип планировщика скорости обучения. Необходимо выбрать варианты "linear", "cosine", "cosine_with_restarts", "polynomial", "constant" и "constant_with_warmup". :ключевое слово model_name: имя модели, используемое во время обучения. Необходимо выбрать один из вариантов : "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased и 'xlnet-large-cased'. :ключевое слово number_of_epochs: количество эпох для обучения. Принимаются только положительные целые числа. :ключевое слово training_batch_size: размер пакета во время обучения. Принимаются только положительные целые числа. :ключевое слово validation_batch_size: размер пакета во время проверки. Принимаются только положительные целые числа. :ключевое слово warmup_ratio: отношение общего числа шагов обучения, используемых для линейной прогрева, от 0 до learning_rate. Должен быть float в [0, 1]. :ключевое слово weight_decay: значение затухания веса, если оптимизатор имеет значение sgd, adam или adamw. Это должно быть число с плавающей точкой в диапазоне [0, 1]. :return: нет.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Параметры
- gradient_accumulation_steps
количество шагов, по которым накапливаются градиенты перед обратным
Исключения
Возникает, если dest — это путь к файлу, а файл уже существует.
Возникает, если dest является открытым файлом и файл не поддерживает запись.
Атрибуты
base_path
creation_context
Контекст создания ресурса.
Возвращаемое значение
Метаданные создания для ресурса.
Возвращаемый тип
featurization
id
Идентификатор ресурса.
Возвращаемое значение
Глобальный идентификатор ресурса, идентификатор Resource Manager Azure (ARM).
Возвращаемый тип
inputs
limits
log_files
Выходные файлы задания.
Возвращаемое значение
Словарь имен и URL-адресов журналов.
Возвращаемый тип
log_verbosity
outputs
primary_metric
search_space
status
Состояние задания.
Обычно возвращаются значения Running (Выполняется), Completed (Завершено) и Failed (Сбой). Все возможные значения:
NotStarted — это временное состояние, в которое клиентские объекты Run находятся перед отправкой в облако.
Starting — началась обработка запуска в облаке. На этом этапе вызывающий объект имеет идентификатор запуска.
Подготовка — вычислительные ресурсы по запросу создаются для заданной отправки задания.
Подготовка — среда выполнения подготавливается и находится в одном из двух этапов:
Сборка образа Docker
настройка среды conda.
В очереди— задание помещается в очередь в целевом объекте вычислений. Например, в BatchAI задание находится в состоянии очереди.
ожидая готовности всех запрошенных узлов.
Выполнение — задание запущено для целевого объекта вычислений.
Завершение — выполнение пользовательского кода завершено, и выполнение выполняется на этапах постобработки.
CancelRequested — для задания запрошена отмена.
Завершено — выполнение успешно завершено. Сюда входит выполнение пользовательского кода и выполнение.
пользовательского кода и запуска.
Failed — сбой запуска. Подробное описание причины как правило предоставляет свойство Error.
Canceled — применяется после запроса отмены и указывает, что выполнение теперь успешно отменено.
NotResponding — для запусков с включенными пульсами недавно не отправлялся пульс.
Возвращаемое значение
Состояние задания.
Возвращаемый тип
studio_url
Конечная точка Студии машинного обучения Azure.
Возвращаемое значение
URL-адрес страницы сведений о задании.
Возвращаемый тип
sweep
task_type
Получение типа задачи.
Возвращаемое значение
Тип выполняемой задачи. Возможные значения: "classification", "regression", "forecasting".
Возвращаемый тип
test_data
training_data
Получение обучающих данных.
Возвращаемое значение
Входные данные для обучения
Возвращаемый тип
training_parameters
type
validation_data
Azure SDK for Python