Ресурсы обучения Построитель моделей Azure
Ниже приведено руководство, которое поможет вам узнать больше о ресурсах, используемых для обучения моделей в Azure с помощью Model Builder.
Что такое эксперимент машинного обучения Azure?
Эксперимент машинного обучения Azure — это ресурс, который необходимо создать перед запуском обучения конструктора моделей в Azure.
Эксперимент инкапсулирует конфигурацию и результаты для одного или нескольких запусков обучения машинного обучения. Эксперименты принадлежат определенной рабочей области. При первом создании эксперимента его имя регистрируется в рабочей области. Все последующие запуски , если используется то же имя эксперимента, регистрируются как часть того же эксперимента. В противном случае создается новый эксперимент.
Что такое рабочая область Машинного обучения Azure?
Рабочая область — это ресурс Машинного обучения Azure, который предоставляет центральное место для всех ресурсов машинного обучения Azure и артефактов, созданных в рамках обучения.
Чтобы создать рабочую область машинного обучения Azure, необходимо выполнить следующие действия.
- Имя: имя рабочей области между 3-33 символами. Имена могут содержать только буквенно-цифровые символы и дефисы.
- Регион: географическое расположение центра обработки данных, в котором развернута рабочая область и ресурсы. Рекомендуется выбрать расположение, близкое к расположению, где вы или ваши клиенты.
- Группа ресурсов: контейнер, содержащий все связанные ресурсы для решения Azure.
Что такое вычисление Машинного обучения Azure?
Вычисление Машинного обучения Azure — это облачная виртуальная машина Linux, используемая для обучения.
Чтобы создать вычислительные ресурсы Машинного обучения Azure, требуются следующие значения:
Имя: имя вычисления между 2–16 символами. Имена могут содержать только буквенно-цифровые символы и дефисы.
Размер вычислительных ресурсов.
Построитель моделей может использовать один из следующих типов вычислительных ресурсов, оптимизированных для GPU:
Размер VCPU Память: ГиБ Временный объем хранилища (SSD) ГиБ Графический процессор Память GPU: ГиБ Максимальное количество дисков данных Максимальное число сетевых адаптеров Standard_NC12 12 112 680 2 24 48 2 Standard_NC24 24 224 1440 4 48 64 4 Дополнительные сведения о оптимизированных типах вычислений GPU см. в документации по виртуальным машинам Linux
серии NC. Приоритет вычислений.
- Низкий приоритет: подходит для задач с более коротким временем выполнения. Задачи могут быть затронуты прерываниями и отсутствием доступности. Этот вариант обычно стоит меньше, так как он использует преимущества избыточной емкости в Azure.
- Выделенный: подходит для задач любой длительности, но особенно длительных заданий. Задачи не влияют на прерывания или отсутствие доступности. Этот вариант обычно стоит больше, так как он резервирует выделенный набор вычислительных ресурсов в Azure для ваших задач.
Тренировка
Обучение в Azure доступно только для сценария классификации образов Конструктора моделей. Алгоритм, используемый для обучения этих моделей, является глубокой нейронной сетью на основе архитектуры ResNet50. Процесс обучения занимает некоторое время, и время может отличаться в зависимости от размера выбранных вычислений, а также объема данных. Вы можете отслеживать ход выполнения, выбрав ссылку "Мониторинг текущего запуска на портале Azure" в Visual Studio.
Результаты
После завершения обучения в решение добавляются два проекта со следующими суффиксами:
ConsoleApp: консольное приложение C#, которое предоставляет начальный код для создания конвейера прогнозирования и создания прогнозов.
модели: приложение C# .NET Standard, содержащее модели данных, определяющие схему входных и выходных данных модели, а также следующие ресурсы:
- bestModel.onnx: сериализованная версия модели в формате Open Neural Network Exchange (ONNX). ONNX — это формат с открытым исходным кодом для моделей ИИ, которые поддерживают взаимодействие между платформами, такими как ML.NET, PyTorch и TensorFlow.
- bestModelMap.json: список категорий, используемых при прогнозировании для сопоставления выходных данных модели с текстовой категорией.
- MLModel.zip: сериализованная версия конвейера прогнозирования ML.NET, использующая сериализованную версию модели bestModel.onnx для прогнозирования и сопоставления выходных данных с помощью файла
bestModelMap.json
.
Использование модели машинного обучения
Классы ModelInput
и ModelOutput
в проекте модели определяют схему ожидаемых входных и выходных данных модели соответственно.
В сценарии классификации изображений ModelInput
содержит два столбца:
-
ImageSource
: строковый путь к расположению изображения. -
Label
: фактическая категория, к которой принадлежит изображение.Label
используется только в качестве входных данных при обучении и не требуется предоставляться при прогнозировании.
ModelOutput
содержит два столбца:
-
Prediction
: прогнозируемая категория изображения. -
Score
: список вероятностей для всех категорий (самый высокий относится кPrediction
).
Устранение неполадок
Не удается создать вычислительные ресурсы
Если во время создания вычислений Машинного обучения Azure возникает ошибка, ресурс вычислений по-прежнему может существовать в состоянии ошибки. При попытке повторного создания вычислительного ресурса с тем же именем операция завершается ошибкой. Чтобы устранить эту ошибку, выполните следующие действия:
- Создание нового вычисления с другим именем
- Перейдите на портал Azure и удалите исходный вычислительный ресурс