Funkce ai_summarize
Platí pro: Databricks SQL
Databricks Runtime
Důležité
Tato funkce je ve verzi Public Preview.
Ve verzi Preview:
- Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
- Pro základní rozhraní API základního modelu existuje omezení rychlosti. Pokud chcete tyto limity aktualizovat, přečtěte si omezení rozhraní API modelu foundation.
- Kvůli omezování rychlosti je tato funkce určená pro testování malých datových sad, které mají méně než 100 řádků. Pro případy použití s více než 100 řádky dat doporučuje Databricks používat
ai_query
a koncový bod zřízené propustnosti. Viz Provedení dávkového odvozování LLM pomocí ai_query.
Funkce ai_summarize()
umožňuje vyvolat nejmodernější model generující umělé inteligence k vygenerování souhrnu daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.
Požadavky
Důležité
Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence Apache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za zajištění dodržování předpisů s příslušnými licencemi modelu.
Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely objeví v budoucnu, které fungují lépe podle interních srovnávacích testů Databricks, může Databricks změnit model (a seznam použitelných licencí uvedených na této stránce).
Meta-Llama-3.1-70B-Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.
- Tato funkce je k dispozici pouze u pracovních prostorů ve funkcích AI s využitím podporovaných oblastí rozhraní API modelu foundation.
- Tato funkce není dostupná v Azure Databricks SQL Classic.
- Podívejte se na stránku s cenami SQL služby Databricks.
Poznámka:
V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.
Syntaxe
ai_summarize(content[, max_words])
Argumenty
-
content
: VýrazSTRING
, text, který se má shrnout. -
max_words
: Volitelný nezáporný celočíselný číselný výraz představující cílový počet slov v vráceném souhrnném textu. Výchozí hodnota je 50. Pokud je nastavená hodnota 0, neexistuje žádný limit pro slovo.
Návraty
Úloha STRING
.
Pokud content
je NULL
, výsledek je NULL
.
Příklady
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."