Delen via


ai_extract-functie

Van toepassing op:vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime

Belangrijk

Deze functie is beschikbaar als openbare preview.

In de preview:

  • Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
  • Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie de limieten van de Foundation Model API's van tot en update voor deze beperkingen.
  • Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om ai_query en een ingerichte doorvoereindpunt te gebruiken. Zie Batch LLM-inferentie uitvoeren met ai_query.

Met ai_extract() de functie kunt u een state-of-the-art AI-model aanroepen om entiteiten te extraheren die zijn opgegeven door labels uit een bepaalde tekst met behulp van SQL. Deze functie maakt gebruik van een chatmodel voor eindpunten dat beschikbaar wordt gesteld door Databricks Foundation Model-API's.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.

Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als er in de toekomst modellen ontstaan die beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de list van de toepasselijke licenties op deze pagina) wijzigen.

Momenteel is Meta-Llama-3.1-70B-Instruct het onderliggende model dat deze AI-functies mogelijk maakt.

Notitie

In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.

Syntaxis

ai_extract(content, labels)

Argumenten

  • content: Een STRING expressie.
  • labels: Een ARRAY<STRING> letterlijke. Elk element is een type entiteit dat moet worden geëxtraheerd.

Retouren

Een STRUCTwhere correspondeert elk veld met een entiteitstype dat is opgegeven in labels. Elk veld bevat een tekenreeks die de geëxtraheerde entiteit vertegenwoordigt. Als er meer dan één kandidaat voor een entiteitstype wordt gevonden, wordt er slechts één geretourneerd.

Als content dat het is NULL, is NULLhet resultaat .

Voorbeelden

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}