第三方在线存储
本文介绍如何使用第三方在线存储来实时提供特征值。 还可以使用 Databricks 联机表提供实时特征服务,所需的设置要少得多。 请参阅 Databricks 联机表。
通过实时服务,可将特征表发布到低延迟数据库,并将模型或特征规格部署到 REST 终结点。
Databricks 特征存储还支持自动特征查找。 在这种情况下,客户端提供的输入值包括仅在推理时可用的值。 该模型会合并逻辑,自动从提供的输入值中提取所需的特征值。
此图说明了 MLflow 与用于实时服务的特征存储组件之间的关系。
Databricks 特征存储支持以下联机存储:
联机存储提供者 | 使用 Unity Catalog 中的特征工程进行发布 | 使用工作区特征存储进行发布 | 旧版 MLflow 模型服务中的特征查找 | 模型服务中的特征查找 |
---|---|---|---|---|
Azure Cosmos DB [1] | X | X(特征存储客户端 v0.5.0 及更高版本) | X | X |
Azure MySQL(单一服务器) | X | X | ||
Azure SQL Server | X |
[1] 有关 Cosmos DB 要求的重要信息,请参阅 Cosmos DB 兼容性说明。
开始使用联机存储
若要开始使用联机存储,请参阅以下文章: