Изучение моделей основы точной настройки в Машинное обучение Azure
Чтобы точно настроить базовую модель из каталога моделей в Машинное обучение Azure, можно использовать пользовательский интерфейс, предоставленный в студии, пакет SDK Для Python или Azure CLI.
Подготовка данных и вычислений
Прежде чем настроить базовую модель для повышения производительности модели, необходимо подготовить обучающие данные и создать вычислительный кластер GPU.
Совет
При создании вычислительного кластера GPU в Машинное обучение Azure будет создана оптимизированная для GPU виртуальная машина. Дополнительные сведения о размерах виртуальных машин GPU, доступных в Azure.
Обучающие данные могут быть в формате JSON Lines (JSONL), CSV или TSV. Требования к данным зависят от конкретной задачи, для которой вы планируете точно настроить модель.
Задача | Требования к набору данных |
---|---|
Классификация текстов | Два столбца: Sentence (строка) и Label (целое число/строка) |
Классификация маркеров | Два столбца: Token (строка) и Tag (строка) |
Ответы на вопросы | Пять столбцов: Question (строка), (строка), Context (строка), Answers (строка), Answers_start (int) и Answers_text (строка) |
Сводка | Два столбца: Document (строка) и Summary (строка) |
Перевод текста | Два столбца: Source_language (строка) и Target_language (строка) |
Примечание.
Набор данных должен иметь необходимые требования. Однако можно использовать разные имена столбцов и сопоставить столбец с соответствующим требованием.
Когда набор данных и вычислительный кластер готовы, можно настроить задание точной настройки в Машинное обучение Azure.
Выбор базовой модели
При переходе к каталогу моделей в Студия машинного обучения Azure можно изучить все базовые модели.
Вы можете отфильтровать доступные модели на основе задачи, для которой требуется точно настроить модель. Для каждой задачи можно выбрать несколько вариантов для базовых моделей. При выборе между базовыми моделями для задачи можно изучить описание модели и карта по ссылке.
Некоторые соображения, которые можно учитывать при выборе базовой модели перед точной настройкой:
- Возможности модели: оцените возможности базовой модели и насколько хорошо они соответствуют вашей задаче. Например, модель, например BERT, лучше понять короткие тексты.
- Предварительное обучение данных. Рассмотрим набор данных, используемый для предварительного обучения базовой модели. Например, GPT-2 обучен на нефильтрованном содержимом из Интернета, что может привести к предвзятости.
- Ограничения и смещения. Помните о любых ограничениях или смещениях, которые могут присутствовать в базовой модели.
- Поддержка языка. Изучите, какие модели предлагают поддержку определенного языка или многоязычные возможности, необходимые для вашего варианта использования.
Совет
Хотя Студия машинного обучения Azure предоставляет описания для каждой базовой модели в каталоге моделей, вы также можете найти дополнительные сведения о каждой модели с помощью соответствующих карта модели. На карта модели ссылаются общие сведения о каждой модели и размещены на веб-сайте Hugging Face
Настройка задания тонкой настройки
Чтобы настроить задание точной настройки с помощью Студия машинного обучения Azure, необходимо выполнить следующие действия.
- Выберите базовую модель.
- Выберите Finetune , чтобы открыть всплывающее окно, которое помогает настроить задание.
- Выберите тип задачи.
- Выберите данные обучения и сопоставите столбцы в обучающих данных с требованиями к набору данных.
- Либо позволить Машинное обучение Azure автоматически разделить обучающие данные, чтобы создать набор данных проверки и тестирования, либо предоставить собственный набор данных.
- Выберите вычислительный кластер GPU, управляемый Машинное обучение Azure.
- Выберите готовое, чтобы отправить задание тонкой настройки.
Совет
При необходимости можно изучить дополнительные параметры для изменения параметров, таких как имя задания тонкой настройки и параметров задачи (например, скорость обучения).
После отправки задания тонкой настройки задание конвейера будет создано для обучения модели. Вы можете просмотреть все входные данные и собрать модель из выходных данных задания.