Прогнозирование (бессерверное) с помощью AutoML

Статья
12/18/2024

Важный

Эта функция доступна в общедоступной предварительной версии.

В этой статье показано, как запустить бессерверный эксперимент прогнозирования с помощью пользовательского интерфейса обучения модели ИИ Мозаики.

Обучение модели ИИ Мозаика — прогнозирование упрощает прогнозирование данных временных рядов, автоматически выбирая оптимальный алгоритм и гиперпараметры, используя полностью управляемые вычислительные ресурсы.

Чтобы понять разницу между бессерверным прогнозированием и классическим прогнозированием вычислений, ознакомьтесь с бессерверным прогнозированием и классическим прогнозированием вычислений.

Требования

Обучающие данные с столбцом временных рядов, сохраненные в таблице каталога Unity.
Если в рабочей области включен шлюз безопасного исходящего трафика (SEG), pypi.org необходимо добавить в список разрешенных доменов. См. Управление политиками сети для контроля бессерверного исходящего трафика.

Создание эксперимента прогнозирования с помощью пользовательского интерфейса

Перейдите на целевую страницу Azure Databricks и щелкните Эксперименты на боковой панели.

На плитке прогнозирования выберите Начать обучение.
Выберите обучающие данные из списка таблиц каталога Unity, к которым можно получить доступ.
- Столбец времени: выберите столбец, содержащий временные периоды для временных рядов. Столбцы должны быть типа timestamp или date.
- частота прогнозирования: выберите единицу времени, представляющую частоту входных данных. Например, минуты, часы, дни, месяцы. Это определяет степень детализации временных рядов.
- горизонт прогнозирования: укажите, сколько единиц выбранной частоты для прогнозирования в будущем. Вместе с частотой прогнозирования это определяет как единицы времени, так и количество единиц времени для прогнозирования.
Заметка

Чтобы использовать алгоритм auto-ARIMA, временные ряды должны иметь обычную частоту, в которой интервал между двумя точками должен быть одинаковым в течение временных рядов. AutoML обрабатывает отсутствующие шаги времени, заполняя эти значения предыдущим значением.
Выберите столбец, для которого вы хотите, чтобы модель сделала прогноз.
При необходимости укажите таблицу каталога Unity путь к данным прогнозирования для хранения выходных прогнозов.
Выберите расположение и имя для регистрации модели и каталога Unity.
При необходимости задайте дополнительные параметры:
- имя эксперимента: укажите имя эксперимента MLflow.
- столбцы идентификаторов временных рядов . Для прогнозирования нескольких рядов выберите столбцы, определяющие отдельные временные ряды. Databricks группирует данные по этим столбцам в виде разных временных рядов и обучает модель для каждой серии независимо.
- Основная метрика: выберите основную метрику, используемую для оценки и выбора лучшей модели.
- платформа обучения: выберите платформы для изучения AutoML.
- Разделение столбцов: выберите столбец, содержащий разделение пользовательских данных. Значения должны быть "train" (обучение), "validate" (валидация), "test" (тестирование)
- столбец для взвешивания: укажите столбец, который следует использовать для взвешивания временных рядов. Все образцы для заданного временного ряда должны иметь одинаковый вес. Вес должен находиться в диапазоне [0, 10000].
- регион праздников: выберите регион праздников для использования в качестве ковариантов в обучении модели.
- время ожидания: задайте максимальную длительность эксперимента AutoML.

Запуск эксперимента и мониторинг результатов

Чтобы запустить эксперимент AutoML, щелкните Начать обучение. На странице обучения экспериментов можно выполнить следующее:

Остановите эксперимент в любое время.
Контроль запусков.
Перейдите на страницу выполнения любой задачи.

Просмотр результатов или использование оптимальной модели

После завершения обучения результаты прогнозирования хранятся в указанной таблице Delta, а лучшая модель регистрируется в каталоге Unity.

На странице экспериментов выберите следующие действия:

Выберите Просмотр прогнозов для просмотра таблицы с результатами прогнозов.
Выберите записную книжку для пакетного вывода, чтобы открыть автоматически созданную записную книжку для пакетного вывода с помощью лучшей модели.
Выберите Создать конечную точку обслуживания для развертывания лучшей модели в конечной точке модельной службы.

бессерверное прогнозирование и классическое прогнозирование вычислений

В следующей таблице перечислены различия между бессерверным прогнозированием и прогнозированием с помощью классических вычислительных

Особенность	Бессерверное прогнозирование	Классическое прогнозирование вычислительных ресурсов
Инфраструктура вычислений	Azure Databricks управляет конфигурацией вычислений и автоматически оптимизирует затраты и производительность.	Настроенные пользователем вычисления
Управление	Модели и артефакты, зарегистрированные в каталоге Unity	Хранилище файлов рабочей области, настроенное пользователем
Выбор алгоритма	Статистические модели плюс алгоритм нейронной сети глубокого обучения DeepAR	Статистические модели
Интеграция хранилища компонентов	Не поддерживается	поддерживаемые
Автоматически созданные записные книжки	Ноутбук пакетного вывода	Исходный код для всех пробных версий
Развертывание модели с одним щелчком мыши	Поддерживается	Неподдерживаемые
Пользовательские разбиения обучения, валидации и тестирования	Поддерживается	Не поддерживается
Пользовательские весы для отдельных временных рядов	Поддерживается	Не поддерживается

Поделиться через