ai_similarity
-Funktion
Gilt für: Databricks SQL Databricks Runtime
Wichtig
Dieses Feature befindet sich in der Public Preview.
In der Preview ist Folgendes enthalten:
- Das zugrunde liegende Sprachmodell kann mehrere Sprachen verarbeiten. Diese Funktionen sind jedoch für Englisch optimiert.
- Für die zugrunde liegenden Foundation-Modell-APIs gibt es Ratenbegrenzung. Weitere Informationen finden Sie unter Foundation Model-APIs, um diese Grenzwerte zu aktualisieren.
Die ai_similarity()
-Funktion ruft ein hochmodernes Modell für generative KI aus den Basismodell-APIs von Databricks auf, um mithilfe von SQL zwei Zeichenfolgen zu vergleichen und den Score der semantischen Ähnlichkeit zu berechnen.
Anforderungen
Wichtig
Die zugrunde liegenden Modelle, die derzeit verwendet werden können, sind unter der Apache 2.0-Lizenz, Copyright The Apache Software Foundation oder der LLAMA 3.1 Community License Copyright © © Meta Platforms, Inc. lizenziert. Alle Rechte vorbehalten. Kunden sind dafür verantwortlich, die Einhaltung anwendbarer Modelllizenzen sicherzustellen.
Databricks empfiehlt, diese Lizenzen zu überprüfen, um die Einhaltung der geltenden Bedingungen zu gewährleisten. Wenn in Zukunft Modelle entstehen, die gemäß den internen Benchmarks von Databricks besser funktionieren, kann Databricks das Modell (und die Liste der anwendbaren Lizenzen auf dieser Seite) ändern.
Derzeit ist GTE Large (Englisch) das zugrunde liegende Modell, das diese KI-Funktion unterstützt.
- Diese Funktion ist ausschließlich verfügbar für Arbeitsbereiche in KI-Funktionen, die von Basismodell-APIs unterstützte Regionen nutzen.
- Diese Funktion ist in Azure Databricks SQL Classic nicht verfügbar.
- Weitere Informationen finden Sie auf der Seite zu den Preisen von Databricks SQL.
Hinweis
In Databricks Runtime 15.1 und höher wird diese Funktion in Databricks-Notebooks unterstützt, einschließlich in Notebooks, die als Task in einem Databricks-Workflow ausgeführt werden.
Syntax
ai_similarity(expr1, expr2)
Argumente
expr1
: EinSTRING
-Ausdruck.expr2
: EinSTRING
-Ausdruck.
Gibt zurück
Ein FLOAT
-Wert, der die semantische Ähnlichkeit zwischen den beiden Eingabezeichenfolgen darstellt. Der Ausgabescore steht im Verhältnis zur Eingabe und sollte lediglich für die Rangfolge verwendet werden. Bei einem Score von 1 sind die beiden Texte gleich.
Beispiele
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.