Ресурсы обучения Построитель моделей Azure

Статья
12/21/2024

Ниже приведено руководство, которое поможет вам узнать больше о ресурсах, используемых для обучения моделей в Azure с помощью Model Builder.

Что такое эксперимент машинного обучения Azure?

Эксперимент машинного обучения Azure — это ресурс, который необходимо создать перед запуском обучения конструктора моделей в Azure.

Эксперимент инкапсулирует конфигурацию и результаты для одного или нескольких запусков обучения машинного обучения. Эксперименты принадлежат определенной рабочей области. При первом создании эксперимента его имя регистрируется в рабочей области. Все последующие запуски , если используется то же имя эксперимента, регистрируются как часть того же эксперимента. В противном случае создается новый эксперимент.

Что такое рабочая область Машинного обучения Azure?

Рабочая область — это ресурс Машинного обучения Azure, который предоставляет центральное место для всех ресурсов машинного обучения Azure и артефактов, созданных в рамках обучения.

Чтобы создать рабочую область машинного обучения Azure, необходимо выполнить следующие действия.

Имя: имя рабочей области между 3-33 символами. Имена могут содержать только буквенно-цифровые символы и дефисы.
Регион: географическое расположение центра обработки данных, в котором развернута рабочая область и ресурсы. Рекомендуется выбрать расположение, близкое к расположению, где вы или ваши клиенты.
Группа ресурсов: контейнер, содержащий все связанные ресурсы для решения Azure.

Что такое вычисление Машинного обучения Azure?

Вычисление Машинного обучения Azure — это облачная виртуальная машина Linux, используемая для обучения.

Чтобы создать вычислительные ресурсы Машинного обучения Azure, требуются следующие значения:

Имя: имя вычисления между 2–16 символами. Имена могут содержать только буквенно-цифровые символы и дефисы.

Размер вычислительных ресурсов.

Построитель моделей может использовать один из следующих типов вычислительных ресурсов, оптимизированных для GPU:

Размер	VCPU	Память: ГиБ	Временный объем хранилища (SSD) ГиБ	Графический процессор	Память GPU: ГиБ	Максимальное количество дисков данных	Максимальное число сетевых адаптеров
Standard_NC12	12	112	680	2	24	48	2
Standard_NC24	24	224	1440	4	48	64	4

Дополнительные сведения о оптимизированных типах вычислений GPU см. в документации по виртуальным машинам Linux серии NC.

Приоритет вычислений.
- Низкий приоритет: подходит для задач с более коротким временем выполнения. Задачи могут быть затронуты прерываниями и отсутствием доступности. Этот вариант обычно стоит меньше, так как он использует преимущества избыточной емкости в Azure.
- Выделенный: подходит для задач любой длительности, но особенно длительных заданий. Задачи не влияют на прерывания или отсутствие доступности. Этот вариант обычно стоит больше, так как он резервирует выделенный набор вычислительных ресурсов в Azure для ваших задач.

Тренировка

Обучение в Azure доступно только для сценария классификации образов Конструктора моделей. Алгоритм, используемый для обучения этих моделей, является глубокой нейронной сетью на основе архитектуры ResNet50. Процесс обучения занимает некоторое время, и время может отличаться в зависимости от размера выбранных вычислений, а также объема данных. Вы можете отслеживать ход выполнения, выбрав ссылку "Мониторинг текущего запуска на портале Azure" в Visual Studio.

Результаты

После завершения обучения в решение добавляются два проекта со следующими суффиксами:

ConsoleApp: консольное приложение C#, которое предоставляет начальный код для создания конвейера прогнозирования и создания прогнозов.
модели: приложение C# .NET Standard, содержащее модели данных, определяющие схему входных и выходных данных модели, а также следующие ресурсы:
- bestModel.onnx: сериализованная версия модели в формате Open Neural Network Exchange (ONNX). ONNX — это формат с открытым исходным кодом для моделей ИИ, которые поддерживают взаимодействие между платформами, такими как ML.NET, PyTorch и TensorFlow.
- bestModelMap.json: список категорий, используемых при прогнозировании для сопоставления выходных данных модели с текстовой категорией.
- MLModel.zip: сериализованная версия конвейера прогнозирования ML.NET, использующая сериализованную версию модели bestModel.onnx для прогнозирования и сопоставления выходных данных с помощью файла bestModelMap.json.

Использование модели машинного обучения

Классы ModelInput и ModelOutput в проекте модели определяют схему ожидаемых входных и выходных данных модели соответственно.

В сценарии классификации изображений ModelInput содержит два столбца:

ImageSource: строковый путь к расположению изображения.
Label: фактическая категория, к которой принадлежит изображение. Label используется только в качестве входных данных при обучении и не требуется предоставляться при прогнозировании.

ModelOutput содержит два столбца:

Prediction: прогнозируемая категория изображения.
Score: список вероятностей для всех категорий (самый высокий относится к Prediction).

Устранение неполадок

Не удается создать вычислительные ресурсы

Если во время создания вычислений Машинного обучения Azure возникает ошибка, ресурс вычислений по-прежнему может существовать в состоянии ошибки. При попытке повторного создания вычислительного ресурса с тем же именем операция завершается ошибкой. Чтобы устранить эту ошибку, выполните следующие действия:

Создание нового вычисления с другим именем
Перейдите на портал Azure и удалите исходный вычислительный ресурс

Поделиться через