Udostępnij za pośrednictwem


Funkcja ai_similarity

Dotyczy: zaznacz pole wyboru oznaczone jako tak Databricks SQL zaznacz pole wyboru oznaczone jako tak Databricks Runtime

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

W wersji zapoznawczej:

  • Podstawowy model językowy może obsługiwać kilka języków, jednak te funkcje są dostrojone w języku angielskim.
  • Istnieje ograniczenie szybkości dla podstawowych interfejsów API modelu podstawowego. Zobacz Limity interfejsów API modelu foundation, aby zaktualizować te limity.

Funkcja ai_similarity() wywołuje najnowocześniejsze model generowania sztucznej inteligencji z interfejsów API modelu usługi Databricks Foundation, aby porównać dwa ciągi i oblicza wskaźnik podobieństwa semantycznego przy użyciu języka SQL.

Wymagania

Ważne

Podstawowe modele, które mogą być używane w tej chwili, są licencjonowane w ramach licencji Apache 2.0, Copyright © The Apache Software Foundation lub LLAMA 3.1 Community License Copyright © Meta Platform, Inc. Wszelkie prawa zastrzeżone. Klienci są odpowiedzialni za zapewnienie zgodności z odpowiednimi licencjami modelu.

Usługa Databricks zaleca przejrzenie tych licencji w celu zapewnienia zgodności z dowolnymi odpowiednimi warunkami. Jeśli modele pojawią się w przyszłości, które działają lepiej zgodnie z wewnętrznymi testami porównawczymi usługi Databricks, usługa Databricks może zmienić model (oraz listę odpowiednich licencji dostępnych na tej stronie).

Obecnie model GTE Large (angielski) jest podstawowym modelem, który obsługuje tę funkcję sztucznej inteligencji.

Uwaga

W środowisku Databricks Runtime 15.1 lub nowszym ta funkcja jest obsługiwana w notesach usługi Databricks, w tym notesach uruchamianych jako zadanie w przepływie pracy usługi Databricks.

Składnia

ai_similarity(expr1, expr2)

Argumenty

  • expr1STRING: wyrażenie.
  • expr2STRING: wyrażenie.

Zwraca

Wartość FLOAT reprezentująca semantyczną podobieństwo między dwoma ciągami wejściowymi. Wynik danych wyjściowych jest względny i powinien być używany tylko do klasyfikowania. Wynik 1 oznacza, że dwa tekst są równe.

Przykłady

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.