Funkce ai_summarize
Platí pro: Databricks SQL Databricks Runtime
Důležité
Tato funkce je ve verzi Public Preview.
Ve verzi Preview:
- Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
- Pro základní rozhraní API základního modelu existuje omezení rychlosti. Podívejte se na omezení rozhraní API modelu foundation na update těchto limitů.
- Kvůli omezování rychlosti je tato funkce určená pro testování malých datových sad, které mají méně než 100 řádků. Pro případy použití s více než 100 řádky dat doporučuje Databricks používat
ai_query
a koncový bod zřízené propustnosti. Viz Provedení dávkového odvozování LLM pomocí ai_query.
Funkce ai_summarize()
umožňuje vyvolat nejmodernější generativní model AI, který generate vytvoří souhrn daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.
Požadavky
Důležité
Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence Apache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za zajištění dodržování předpisů s příslušnými licencemi modelu.
Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se v budoucnu objeví modely, které fungují lépe podle interních srovnávacích testů Databricks, Databricks může model změnit (a také list příslušných licencí uvedených na této stránce).
Meta-Llama-3.1-70B-Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.
- Tato funkce je k dispozici pouze u pracovních prostorů ve funkcích AI s využitím podporovaných oblastí rozhraní API modelu foundation.
- Tato funkce není dostupná v Azure Databricks SQL Classic.
- Podívejte se na stránku s cenami SQL služby Databricks.
Poznámka:
V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.
Syntaxe
ai_summarize(content[, max_words])
Argumenty
-
content
: VýrazSTRING
, text, který se má shrnout. -
max_words
: Volitelný nezáporný celočíselný číselný výraz představující cílový počet slov v vráceném souhrnném textu. Výchozí hodnota je 50. Pokud je set na 0, neexistuje žádné slovo limit.
Návraty
Úloha STRING
.
Pokud content
je NULL
, výsledek je NULL
.
Příklady
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."