Funkce ai_extract
Platí pro: Databricks SQL Databricks Runtime
Důležité
Tato funkce je ve verzi Public Preview.
Ve verzi Preview:
- Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
- Pro základní rozhraní API základního modelu existuje omezení rychlosti. Pokud chcete tyto limity aktualizovat, přečtěte si omezení rozhraní API modelu foundation.
- Kvůli omezování rychlosti je tato funkce určená pro testování malých datových sad, které mají méně než 100 řádků. Pro případy použití s více než 100 řádky dat doporučuje Databricks používat
ai_query
a koncový bod zřízené propustnosti. Viz Provedení dávkového inferování LLM s využitím ai_query.
Funkce ai_extract()
umožňuje vyvolat nejmodernější model generující umělé inteligence k extrakci entit určených popisky z daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.
Požadavky
Důležité
Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence Apache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za zajištění dodržování předpisů s příslušnými licencemi modelu.
Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely objeví v budoucnu, které fungují lépe podle interních srovnávacích testů Databricks, může Databricks změnit model (a seznam použitelných licencí uvedených na této stránce).
Meta-Llama-3.1-70B-Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.
- Tato funkce je k dispozici pouze u pracovních prostorů ve funkcích AI s využitím podporovaných oblastí rozhraní API modelu foundation.
- Tato funkce není dostupná v Azure Databricks SQL Classic.
- Podívejte se na stránku s cenami SQL služby Databricks.
Poznámka:
V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.
Syntaxe
ai_extract(content, labels)
Argumenty
-
content
: VýrazSTRING
. -
labels
: LiterálARRAY<STRING>
. Každý prvek je typ entity, která se má extrahovat.
Návraty
STRUCT
, kde každé pole odpovídá typu entity zadanému v labels
. Každé pole obsahuje řetězec představující extrahovaná entita. Pokud se najde více než jeden kandidát pro jakýkoli typ entity, vrátí se pouze jeden.
Pokud content
je NULL
, výsledek je NULL
.
Příklady
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}