Delen via


ai_similarity-functie

Van toepassing op:vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime

Belangrijk

Deze functie is beschikbaar als openbare preview.

In de preview:

  • Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
  • Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie de limieten voor Foundation Model API's tot update voor deze limieten.
  • Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om ai_query en een ingerichte doorvoereindpunt te gebruiken. Zie Batch LLM-inferentie uitvoeren met behulp van ai_query.

De ai_similarity() functie roept een state-of-the-art AI-model aan van Databricks Foundation Model-API's om twee tekenreeksen te vergelijken en berekent de semantische overeenkomstenscore met behulp van SQL.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.

Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als er in de toekomst modellen ontstaan die beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de list van de toepasselijke licenties op deze pagina) wijzigen.

Op dit moment is GTE Large (Engels) het onderliggende model dat deze AI-functie mogelijk maakt.

Notitie

In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.

Syntaxis

ai_similarity(expr1, expr2)

Argumenten

  • expr1: Een STRING expressie.
  • expr2: Een STRING expressie.

Retouren

Een FLOAT waarde, die de semantische gelijkenis tussen de twee invoertekenreeksen vertegenwoordigt. De uitvoerscore is relatief en mag alleen worden gebruikt voor classificatie. Score van 1 betekent dat de twee tekst gelijk zijn.

Voorbeelden

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 10;

  Databricks Inc.