Partager via


Fonction ai_classify

S’applique à :case marquée oui Databricks SQL case marquée oui Databricks Runtime

Important

Cette fonctionnalité est disponible en préversion publique.

Dans la préversion :

  • Le modèle de langage sous-jacent peut gérer plusieurs langues. Toutefois, ces fonctions sont optimisées pour l’anglais.
  • Il existe une limitation de débit pour les API Foundation Model sous-jacentes. Pour mettre à jour ces limites, consultez Limites des API Foundation Model.
  • En raison de la limitation du débit, cette fonction est conçue pour les tests sur de petits jeux de données qui ont moins de 100 lignes. Pour les cas d’usage avec plus de 100 lignes de données, Databricks recommande d’utiliser ai_query et un point de terminaison de débit approvisionné. Voir Effectuer une inférence LLM par lot à l'aide de l’ai_query.

La fonction ai_classify() vous permet d’appeler un modèle IA génératif de pointe pour classifier le texte d’entrée en fonction des étiquettes que vous fournissez à l’aide de SQL. Cette fonction utilise un modèle de conversation servant un point de terminaison rendu disponible par des API Databricks Foundation Model.

Spécifications

Important

Les modèles sous-jacents qui peuvent être utilisés à ce stade sont concédés sous licence sous la licence Apache 2.0 License, Copyright © The Apache Software Foundation ou the LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Tous les droits réservés. Les clients sont tenus de d’assurer de leur conformité vis-à-vis des licences de modèle applicables.

Databricks recommande de passer en revue ces licences pour vérifier leur conformité avec les conditions applicables. Si les modèles émergent à l’avenir qui fonctionnent mieux en fonction des benchmarks internes de Databricks, Databricks peut modifier le modèle (et la liste des licences applicables fournies sur cette page).

Actuellement, Meta-Llama-3.3-70B-Instruct est le modèle sous-jacent qui alimente ces fonctions IA.

Remarque

Dans Databricks Runtime 15.1 et versions ultérieures, cette fonction est prise en charge dans les notebooks Databricks, notamment ceux exécutés en tant que tâche dans un workflow Databricks.

Syntaxe

ai_classify(content, labels)

Arguments

  • content : une expression STRING, le texte à classer.
  • labels: un littéral ARRAY<STRING>, des étiquettes de classification de sortie attendues. Doit contenir au moins 2 éléments, et pas plus de 20 éléments.

Retours

STRING. La valeur correspond à l’une des chaînes fournies dans l’argument labels. Retourne null si content ne peut pas être classé.

Exemples

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products
  LIMIT 10;