Funkcja ai_similarity
Dotyczy: Databricks SQL Databricks Runtime
Ważne
Ta funkcja jest dostępna w publicznej wersji zapoznawczej.
W wersji zapoznawczej:
- Podstawowy model językowy może obsługiwać kilka języków, jednak te funkcje są dostrojone w języku angielskim.
- Istnieje ograniczenie szybkości dla podstawowych interfejsów API modelu podstawowego. Zobacz Limity interfejsów API modelu foundation, aby zaktualizować te limity.
Funkcja ai_similarity()
wywołuje najnowocześniejsze model generowania sztucznej inteligencji z interfejsów API modelu usługi Databricks Foundation, aby porównać dwa ciągi i oblicza wskaźnik podobieństwa semantycznego przy użyciu języka SQL.
Wymagania
Ważne
Podstawowe modele, które mogą być używane w tej chwili, są licencjonowane w ramach licencji Apache 2.0, Copyright © The Apache Software Foundation lub LLAMA 3.1 Community License Copyright © Meta Platform, Inc. Wszelkie prawa zastrzeżone. Klienci są odpowiedzialni za zapewnienie zgodności z odpowiednimi licencjami modelu.
Usługa Databricks zaleca przejrzenie tych licencji w celu zapewnienia zgodności z dowolnymi odpowiednimi warunkami. Jeśli modele pojawią się w przyszłości, które działają lepiej zgodnie z wewnętrznymi testami porównawczymi usługi Databricks, usługa Databricks może zmienić model (oraz listę odpowiednich licencji dostępnych na tej stronie).
Obecnie model GTE Large (angielski) jest podstawowym modelem, który obsługuje tę funkcję sztucznej inteligencji.
- Ta funkcja jest dostępna tylko w obszarach roboczych w usłudze AI Functions przy użyciu obsługiwanych regionów interfejsów API modelu foundation.
- Ta funkcja nie jest dostępna w usłudze Azure Databricks SQL Classic.
- Sprawdź stronę cennika usługi Databricks SQL.
Uwaga
W środowisku Databricks Runtime 15.1 lub nowszym ta funkcja jest obsługiwana w notesach usługi Databricks, w tym notesach uruchamianych jako zadanie w przepływie pracy usługi Databricks.
Składnia
ai_similarity(expr1, expr2)
Argumenty
expr1
STRING
: wyrażenie.expr2
STRING
: wyrażenie.
Zwraca
Wartość FLOAT
reprezentująca semantyczną podobieństwo między dwoma ciągami wejściowymi. Wynik danych wyjściowych jest względny i powinien być używany tylko do klasyfikowania. Wynik 1 oznacza, że dwa tekst są równe.
Przykłady
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.