Udostępnij za pośrednictwem


Funkcja ai_extract

Dotyczy: zaznacz pole wyboru oznaczone jako tak Databricks SQL zaznacz pole wyboru oznaczone jako tak Databricks Runtime

Ważne

Ta funkcja jest dostępna w publicznej wersji zapoznawczej.

W wersji zapoznawczej:

  • Podstawowy model językowy może obsługiwać kilka języków, jednak te funkcje są dostrojone w języku angielskim.
  • Istnieje ograniczenie szybkości dla podstawowych interfejsów API modelu podstawowego. Zobacz Limity interfejsów API modelu foundation, aby zaktualizować te limity.

Funkcja ai_extract() umożliwia wywoływanie najnowocześniejszego modelu generowania sztucznej inteligencji w celu wyodrębnienia jednostek określonych przez etykiety z danego tekstu przy użyciu języka SQL. Ta funkcja używa modelu czatu obsługującego punkt końcowy udostępniany przez interfejsy API modelu usługi Databricks Foundation.

Wymagania

Ważne

Podstawowe modele, które mogą być używane w tej chwili, są licencjonowane w ramach licencji Apache 2.0, Copyright © The Apache Software Foundation lub LLAMA 3.1 Community License Copyright © Meta Platform, Inc. Wszelkie prawa zastrzeżone. Klienci są odpowiedzialni za zapewnienie zgodności z odpowiednimi licencjami modelu.

Usługa Databricks zaleca przejrzenie tych licencji w celu zapewnienia zgodności z dowolnymi odpowiednimi warunkami. Jeśli modele pojawią się w przyszłości, które działają lepiej zgodnie z wewnętrznymi testami porównawczymi usługi Databricks, usługa Databricks może zmienić model (oraz listę odpowiednich licencji dostępnych na tej stronie).

Obecnie Meta-Llama-3.1-70B-Instruct jest podstawowym modelem obsługującym te funkcje sztucznej inteligencji.

Uwaga

W środowisku Databricks Runtime 15.1 lub nowszym ta funkcja jest obsługiwana w notesach usługi Databricks, w tym notesach uruchamianych jako zadanie w przepływie pracy usługi Databricks.

Składnia

ai_extract(content, labels)

Argumenty

  • contentSTRING: wyrażenie.
  • labelsARRAY<STRING>: literał. Każdy element jest typem jednostki do wyodrębnienia.

Zwraca

MiejsceSTRUCT, w którym każde pole odpowiada typowi jednostki określonej w .labels Każde pole zawiera ciąg reprezentujący wyodrębnionej jednostki. Jeśli zostanie znaleziony więcej niż jeden kandydat dla dowolnego typu jednostki, zwracany jest tylko jeden.

Jeśli content wartość to NULL, wynik to NULL.

Przykłady

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}