Поделиться через


Ресурсы обучения Построитель моделей Azure

Ниже приведено руководство, которое поможет вам узнать больше о ресурсах, используемых для обучения моделей в Azure с помощью Model Builder.

Что такое эксперимент машинного обучения Azure?

Эксперимент машинного обучения Azure — это ресурс, который необходимо создать перед запуском обучения конструктора моделей в Azure.

Эксперимент инкапсулирует конфигурацию и результаты для одного или нескольких запусков обучения машинного обучения. Эксперименты принадлежат определенной рабочей области. При первом создании эксперимента его имя регистрируется в рабочей области. Все последующие запуски , если используется то же имя эксперимента, регистрируются как часть того же эксперимента. В противном случае создается новый эксперимент.

Что такое рабочая область Машинного обучения Azure?

Рабочая область — это ресурс Машинного обучения Azure, который предоставляет центральное место для всех ресурсов машинного обучения Azure и артефактов, созданных в рамках обучения.

Чтобы создать рабочую область машинного обучения Azure, необходимо выполнить следующие действия.

  • Имя: имя рабочей области между 3-33 символами. Имена могут содержать только буквенно-цифровые символы и дефисы.
  • Регион: географическое расположение центра обработки данных, в котором развернута рабочая область и ресурсы. Рекомендуется выбрать расположение, близкое к расположению, где вы или ваши клиенты.
  • Группа ресурсов: контейнер, содержащий все связанные ресурсы для решения Azure.

Что такое вычисление Машинного обучения Azure?

Вычисление Машинного обучения Azure — это облачная виртуальная машина Linux, используемая для обучения.

Чтобы создать вычислительные ресурсы Машинного обучения Azure, требуются следующие значения:

  • Имя: имя вычисления между 2–16 символами. Имена могут содержать только буквенно-цифровые символы и дефисы.

  • Размер вычислительных ресурсов.

    Построитель моделей может использовать один из следующих типов вычислительных ресурсов, оптимизированных для GPU:

    Размер VCPU Память: ГиБ Временный объем хранилища (SSD) ГиБ Графический процессор Память GPU: ГиБ Максимальное количество дисков данных Максимальное число сетевых адаптеров
    Standard_NC12 12 112 680 2 24 48 2
    Standard_NC24 24 224 1440 4 48 64 4

    Дополнительные сведения о оптимизированных типах вычислений GPU см. в документации по виртуальным машинам Linux серии NC.

  • Приоритет вычислений.

    • Низкий приоритет: подходит для задач с более коротким временем выполнения. Задачи могут быть затронуты прерываниями и отсутствием доступности. Этот вариант обычно стоит меньше, так как он использует преимущества избыточной емкости в Azure.
    • Выделенный: подходит для задач любой длительности, но особенно длительных заданий. Задачи не влияют на прерывания или отсутствие доступности. Этот вариант обычно стоит больше, так как он резервирует выделенный набор вычислительных ресурсов в Azure для ваших задач.

Тренировка

Обучение в Azure доступно только для сценария классификации образов Конструктора моделей. Алгоритм, используемый для обучения этих моделей, является глубокой нейронной сетью на основе архитектуры ResNet50. Процесс обучения занимает некоторое время, и время может отличаться в зависимости от размера выбранных вычислений, а также объема данных. Вы можете отслеживать ход выполнения, выбрав ссылку "Мониторинг текущего запуска на портале Azure" в Visual Studio.

Результаты

После завершения обучения в решение добавляются два проекта со следующими суффиксами:

  • ConsoleApp: консольное приложение C#, которое предоставляет начальный код для создания конвейера прогнозирования и создания прогнозов.

  • модели: приложение C# .NET Standard, содержащее модели данных, определяющие схему входных и выходных данных модели, а также следующие ресурсы:

    • bestModel.onnx: сериализованная версия модели в формате Open Neural Network Exchange (ONNX). ONNX — это формат с открытым исходным кодом для моделей ИИ, которые поддерживают взаимодействие между платформами, такими как ML.NET, PyTorch и TensorFlow.
    • bestModelMap.json: список категорий, используемых при прогнозировании для сопоставления выходных данных модели с текстовой категорией.
    • MLModel.zip: сериализованная версия конвейера прогнозирования ML.NET, использующая сериализованную версию модели bestModel.onnx для прогнозирования и сопоставления выходных данных с помощью файла bestModelMap.json.

Использование модели машинного обучения

Классы ModelInput и ModelOutput в проекте модели определяют схему ожидаемых входных и выходных данных модели соответственно.

В сценарии классификации изображений ModelInput содержит два столбца:

  • ImageSource: строковый путь к расположению изображения.
  • Label: фактическая категория, к которой принадлежит изображение. Label используется только в качестве входных данных при обучении и не требуется предоставляться при прогнозировании.

ModelOutput содержит два столбца:

  • Prediction: прогнозируемая категория изображения.
  • Score: список вероятностей для всех категорий (самый высокий относится к Prediction).

Устранение неполадок

Не удается создать вычислительные ресурсы

Если во время создания вычислений Машинного обучения Azure возникает ошибка, ресурс вычислений по-прежнему может существовать в состоянии ошибки. При попытке повторного создания вычислительного ресурса с тем же именем операция завершается ошибкой. Чтобы устранить эту ошибку, выполните следующие действия:

  • Создание нового вычисления с другим именем
  • Перейдите на портал Azure и удалите исходный вычислительный ресурс