Fonction `ai_similarity`

Article
10/26/2024

S’applique à : case marquée oui Databricks SQL Databricks Runtime

Important

Cette fonctionnalité est disponible en préversion publique.

Dans la préversion :

Le modèle de langage sous-jacent peut gérer plusieurs langues. Toutefois, ces fonctions sont optimisées pour l’anglais.
Il existe une limitation de débit pour les API Foundation Model sous-jacentes. Consultez Limites des API Foundation Model pour mettre à jour ces limites.

La fonction ai_similarity() appelle un modèle d’IA dégénérative de Databricks Foundation Model pour comparer deux chaînes et calcule le score de similarité sémantique à l’aide de SQL.

Spécifications

Important

Les modèles sous-jacents qui peuvent être utilisés à ce stade sont sous licence sous licence Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License © Meta Platforms, Inc. Tous les droits réservés. Les clients sont tenus de d’assurer de leur conformité vis-à-vis des licences de modèle applicables.

Databricks recommande de passer en revue ces licences pour vérifier leur conformité avec les conditions applicables. Si les modèles émergent à l’avenir qui fonctionnent mieux en fonction des benchmarks internes de Databricks, Databricks peut modifier le modèle (et la liste des licences applicables fournies sur cette page).

Actuellement, GTE Large (anglais) est le modèle sous-jacent qui alimente cette fonction IA.

Cette fonction est disponible uniquement pour les espaces de travail des régions prises en charge AI Functions avec les API Foundation Model.
Cette fonction n’est pas disponible sur Azure Databricks SQL classique.
Consultez la page de tarification de Databricks SQL.

Remarque

Dans Databricks Runtime 15.1 et versions ultérieures, cette fonction est prise en charge dans les notebooks Databricks, notamment ceux exécutés en tant que tâche dans un workflow Databricks.

Syntaxe

ai_similarity(expr1, expr2)

Arguments

expr1 : expression STRING.
expr2 : expression STRING.

Retours

Valeur FLOAT représentant la similarité sémantique entre les deux chaînes d’entrée. Le score de sortie est relatif et ne doit être utilisé que pour le classement. Le score de 1 signifie que les deux textes sont égaux.

Exemples

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.

Partager via

Fonction `ai_similarity`

Spécifications

Syntaxe

Arguments

Retours

Exemples

Commentaires

Ressources supplémentaires

Partager via

Fonction ai_similarity

Spécifications

Syntaxe

Arguments

Retours

Exemples

Commentaires

Ressources supplémentaires

Fonction `ai_similarity`