ai_similarity
-functie
Van toepassing op: Databricks SQL Databricks Runtime
Belangrijk
Deze functie is beschikbaar als openbare preview.
In de preview:
- Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
- Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie de limieten voor Foundation Model API's tot update voor deze limieten.
- Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om
ai_query
en een ingerichte doorvoereindpunt te gebruiken. Zie Batch LLM-inferentie uitvoeren met behulp van ai_query.
De ai_similarity()
functie roept een state-of-the-art AI-model aan van Databricks Foundation Model-API's om twee tekenreeksen te vergelijken en berekent de semantische overeenkomstenscore met behulp van SQL.
Vereisten
Belangrijk
De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.
Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als er in de toekomst modellen ontstaan die beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de list van de toepasselijke licenties op deze pagina) wijzigen.
Op dit moment is GTE Large (Engels) het onderliggende model dat deze AI-functie mogelijk maakt.
- Deze functie is alleen beschikbaar voor werkruimten in AI Functions met behulp van ondersteunde regio's voor Foundation-model-API's.
- Deze functie is niet beschikbaar in Azure Databricks SQL Classic.
- Controleer de pagina met prijzen voor Databricks SQL.
Notitie
In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.
Syntaxis
ai_similarity(expr1, expr2)
Argumenten
-
expr1
: EenSTRING
expressie. -
expr2
: EenSTRING
expressie.
Retouren
Een FLOAT
waarde, die de semantische gelijkenis tussen de twee invoertekenreeksen vertegenwoordigt. De uitvoerscore is relatief en mag alleen worden gebruikt voor classificatie. Score van 1 betekent dat de twee tekst gelijk zijn.
Voorbeelden
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 10;
Databricks Inc.