Автоматическое поиск функций с помощью Службы моделей Databricks
Model Serving может автоматически искать значения фич из опубликованных онлайн-репозиториев или из онлайн-таблиц. Дополнительные сведения о создании и работе с онлайн-таблицами см. в статье Использование интерактивных таблиц для функций, обслуживающихв режиме реального времени.
Требования
- Модель должна быть зарегистрирована с использованием
FeatureEngineeringClient.log_model
(для инжиниринга характеристик в каталоге Unity) илиFeatureStoreClient.log_model
(для устаревшего хранилища характеристик рабочей области), и требуется версия 0.3.5 или выше. - Для сторонних интернет-магазинов интернет-магазин должен быть опубликован с учетными данными только для чтения.
Примечание.
Вы можете публиковать таблицу компонентов в любое время до развертывания модели, включая после обучения модели.
Автоматический поиск функций
Служба моделей Azure Databricks поддерживает автоматический поиск функций из следующих интернет-магазинов:
- Онлайн таблицы Databricks
- Azure Cosmos DB (версия 0.5.0 и выше)
Автоматический поиск признаков поддерживается для следующих типов данных:
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
Переопределение значений характеристик при оценке модели в режиме онлайн
Все функции, необходимые модели (отмеченные FeatureEngineeringClient.log_model
или FeatureStoreClient.log_model
), автоматически получают из интернет-магазинов для оценки моделей. Чтобы переопределить значения признаков при оценке модели с помощью REST API с эксплуатацией моделей, нужно включить значения признаков в полезные данные API.
Примечание.
Новые значения признаков должны соответствовать типу данных компонента, как ожидалось базовой моделью.
Сохранить дополненный DataFrame в таблице-инференции
Для конечных точек, создаваемых начиная с февраля 2025 года, можно настроить конечную точку обслуживания модели для регистрации дополненного DataFrame, содержащего значения признаков, полученные из базы данных, и возвращаемые значения функций. Кадр данных сохраняется в таблице вывода для обслуживаемой модели.
Инструкции по настройке этой конфигурации см. в разделе Функции поиска кадров данных для вывода таблиц.
Сведения о таблицах вывода см. в таблицах вывода для мониторинга и отладки моделей.
Примеры записных книжек : каталог Unity
С помощью Databricks Runtime 13.3 LTS и более поздних версий любая таблица Delta в каталоге Unity с первичным ключом можно использовать в качестве таблицы функций. При использовании таблицы, зарегистрированной в каталоге Unity в качестве таблицы компонентов, все возможности каталога Unity автоматически доступны для таблицы компонентов.
В следующей записной книжке показано, как публиковать функции в онлайн-таблицах для обслуживания в режиме реального времени и автоматического поиска функций.
Демонстрационный онлайн-блокнот для таблиц
В этом примере записной книжки показано, как публиковать функции в интернет-магазине, а затем обслуживать обученную модель, которая автоматически ищет функции в интернет-магазине.
Пример блокнота для сторонних интернет-магазинов (Unity Catalog)
Примеры записных книжек: хранилище компонентов рабочей области (устаревшая версия)
В этом примере записной книжки показано, как публиковать функции в интернет-магазине, а затем обслуживать обученную модель, которая автоматически ищет функции в интернет-магазине.