Sdílet prostřednictvím


Funkce ai_summarize

Platí pro:zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview.

Ve verzi Preview:

  • Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
  • Pro základní rozhraní API základního modelu existuje omezení rychlosti. Podívejte se na omezení rozhraní API modelu foundation na update těchto limitů.
  • Kvůli omezování rychlosti je tato funkce určená pro testování malých datových sad, které mají méně než 100 řádků. Pro případy použití s více než 100 řádky dat doporučuje Databricks používat ai_query a koncový bod zřízené propustnosti. Viz Provedení dávkového odvozování LLM pomocí ai_query.

Funkce ai_summarize() umožňuje vyvolat nejmodernější generativní model AI, který generate vytvoří souhrn daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.

Požadavky

Důležité

Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence Apache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za zajištění dodržování předpisů s příslušnými licencemi modelu.

Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se v budoucnu objeví modely, které fungují lépe podle interních srovnávacích testů Databricks, Databricks může model změnit (a také list příslušných licencí uvedených na této stránce).

Meta-Llama-3.1-70B-Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.

Poznámka:

V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.

Syntaxe

ai_summarize(content[, max_words])

Argumenty

  • content: Výraz STRING , text, který se má shrnout.
  • max_words: Volitelný nezáporný celočíselný číselný výraz představující cílový počet slov v vráceném souhrnném textu. Výchozí hodnota je 50. Pokud je set na 0, neexistuje žádné slovo limit.

Návraty

Úloha STRING.

Pokud content je NULL, výsledek je NULL.

Příklady

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."