Поделиться через


Автоматическое поиск функций с помощью Службы моделей Databricks

Model Serving может автоматически искать значения фич из опубликованных онлайн-репозиториев или из онлайн-таблиц. Дополнительные сведения о создании и работе с онлайн-таблицами см. в статье Использование интерактивных таблиц для функций, обслуживающихв режиме реального времени.

Требования

  • Модель должна быть зарегистрирована с использованием FeatureEngineeringClient.log_model (для инжиниринга характеристик в каталоге Unity) или FeatureStoreClient.log_model (для устаревшего хранилища характеристик рабочей области), и требуется версия 0.3.5 или выше.
  • Для сторонних интернет-магазинов интернет-магазин должен быть опубликован с учетными данными только для чтения.

Примечание.

Вы можете публиковать таблицу компонентов в любое время до развертывания модели, включая после обучения модели.

Автоматический поиск функций

Служба моделей Azure Databricks поддерживает автоматический поиск функций из следующих интернет-магазинов:

Автоматический поиск признаков поддерживается для следующих типов данных:

  • IntegerType
  • FloatType
  • BooleanType
  • StringType
  • DoubleType
  • LongType
  • TimestampType
  • DateType
  • ShortType
  • DecimalType
  • ArrayType
  • MapType

Переопределение значений характеристик при оценке модели в режиме онлайн

Все функции, необходимые модели (отмеченные FeatureEngineeringClient.log_model или FeatureStoreClient.log_model), автоматически получают из интернет-магазинов для оценки моделей. Чтобы переопределить значения признаков при оценке модели с помощью REST API с эксплуатацией моделей, нужно включить значения признаков в полезные данные API.

Примечание.

Новые значения признаков должны соответствовать типу данных компонента, как ожидалось базовой моделью.

Сохранить дополненный DataFrame в таблице-инференции

Для конечных точек, создаваемых начиная с февраля 2025 года, можно настроить конечную точку обслуживания модели для регистрации дополненного DataFrame, содержащего значения признаков, полученные из базы данных, и возвращаемые значения функций. Кадр данных сохраняется в таблице вывода для обслуживаемой модели.

Инструкции по настройке этой конфигурации см. в разделе Функции поиска кадров данных для вывода таблиц.

Сведения о таблицах вывода см. в таблицах вывода для мониторинга и отладки моделей.

Примеры записных книжек : каталог Unity

С помощью Databricks Runtime 13.3 LTS и более поздних версий любая таблица Delta в каталоге Unity с первичным ключом можно использовать в качестве таблицы функций. При использовании таблицы, зарегистрированной в каталоге Unity в качестве таблицы компонентов, все возможности каталога Unity автоматически доступны для таблицы компонентов.

В следующей записной книжке показано, как публиковать функции в онлайн-таблицах для обслуживания в режиме реального времени и автоматического поиска функций.

Демонстрационный онлайн-блокнот для таблиц

Получи ноутбук

В этом примере записной книжки показано, как публиковать функции в интернет-магазине, а затем обслуживать обученную модель, которая автоматически ищет функции в интернет-магазине.

Пример блокнота для сторонних интернет-магазинов (Unity Catalog)

Получи ноутбук

Примеры записных книжек: хранилище компонентов рабочей области (устаревшая версия)

В этом примере записной книжки показано, как публиковать функции в интернет-магазине, а затем обслуживать обученную модель, которая автоматически ищет функции в интернет-магазине.

Пример записной книжки сторонних интернет-магазинов (хранилище компонентов рабочей области)

Получи ноутбук