Partager via


Magasin de caractéristiques d’un espace de travail (hérité)

Remarque

Cette documentation couvre le magasin de caractéristiques d’espace de travail. Utilisez cette page uniquement si votre espace de travail n’est pas activé pour Unity Catalog.

Databricks recommande d’utiliser l’ingénierie de caractéristiques dans Unity Catalog. Le magasin de caractéristiques d’espace de travail va être déprécié.

Pourquoi utiliser le magasin de fonctionnalités de l'espace de travail ?

Le magasin de fonctionnalités de l’espace de travail est entièrement intégré à d’autres composants d’Azure Databricks.

  • Découvrabilité. L’interface utilisateur du magasin de caractéristiques, accessible depuis l’espace de travail Databricks, vous permet de parcourir et de rechercher les caractéristiques existantes.
  • Traçabilité. Quand vous créez une table de fonctionnalités dans Azure Databricks, les sources de données utilisées pour créer la table de fonctionnalités sont enregistrées et accessibles. Pour chaque caractéristique d’une table de caractéristiques, vous pouvez aussi accéder aux modèles, aux notebooks, aux travaux et aux points de terminaison qui utilisent la caractéristique.
  • Intégration avec le scoring et le service des modèles. Quand vous utilisez des caractéristiques du magasin de caractéristiques pour entraîner un modèle, le modèle est empaqueté avec les métadonnées des caractéristiques. Quand vous utilisez le modèle pour du scoring par lot ou de l’inférence en ligne, il récupère automatiquement les caractéristiques auprès du magasin de caractéristiques. L’appelant n’a pas besoin d’en savoir plus sur les caractéristiques, ou d’inclure une logique pour rechercher ou joindre des caractéristiques pour calculer le score de nouvelles données. Ceci facilite le déploiement et les mises à jour des modèles.
  • Recherches ponctuelles dans le temps. Le magasin de caractéristiques prend en charge les cas d’usage de série chronologique et basés sur des événements qui nécessitent une exactitude à un point dans le temps.

Comment fonctionne le magasin de fonctionnalités de l’espace de travail ?

Le processus du workflow Machine Learning classique utilisant le magasin de caractéristiques est le suivant :

  1. Écrivez du code pour convertir des données brutes en caractéristiques et créez un DataFrame Spark contenant les caractéristiques souhaitées.
  2. Écrivez le DataFrame en tant que table de caractéristiques dans le magasin de fonctionnalités de l’espace de travail.
  3. Entraînez un modèle en utilisant des caractéristiques du magasin de caractéristiques. Quand vous procédez ainsi, le modèle stocke les spécifications des caractéristiques utilisées pour l’entraînement. Lorsque le modèle est utilisé pour l’inférence, il joint automatiquement des caractéristiques à partir des tables de caractéristiques appropriées.
  4. Inscrivez le modèle dans le registre de modèles.

Vous pouvez maintenant utiliser ce modèle pour effectuer des prédictions sur de nouvelles données. Pour les cas d’usage de traitement par lots, le modèle récupère automatiquement les caractéristiques dont il a besoin dans le magasin de caractéristiques.

Workflow du magasin de fonctionnalités pour les cas d’usage par lots de Machine Learning.

Pour les cas d’usage de service en temps réel, publiez les caractéristiques dans un magasin en ligne. Consultez Magasins tiers en ligne.

Au moment de l’inférence, le modèle lit les fonctionnalités précalculées du magasin en ligne et les joint aux données fournies dans la requête du client au point de terminaison de mise en service du modèle.

Flux du magasin de fonctionnalités pour les modèles Machine Learning qui sont traités.

Commencer à utiliser le magasin de fonctionnalités de l’espace de travail

Pour commencer, essayez ces exemples de notebooks. Le notebook de base vous guide tout au long de la création d’une table de caractéristiques, de son utilisation pour entraîner un modèle, puis d’effectuer un scoring par lot en utilisant la recherche automatique de fonctionnalités. Il vous présente également l’interface utilisateur Magasin de caractéristiques et vous montre comment l’utiliser pour rechercher des fonctionnalités et comprendre comment les fonctionnalités sont créées et utilisées.

Exemple de notebook de magasin de caractéristiques d’espace de travail de base

Obtenir le notebook

L’exemple de notebook sur les taxis illustre le processus de création de caractéristiques, leur mise à jour et leur utilisation pour l’apprentissage de modèle et l’inférence par lots.

Exemple de notebook sur les taxis du magasin de caractéristiques d’espace de travail

Obtenir le notebook

Types de données pris en charge

Pour obtenir la liste des types de données pris en charge, consultez Types de données pris en charge.