ai_summarize
-functie
Van toepassing op: Databricks SQL
Databricks Runtime
Belangrijk
Deze functie is beschikbaar als openbare preview.
In de preview:
- Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
- Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie Foundation Model API's limieten om deze limieten bij te werken.
- Vanwege snelheidsbeperking is deze functie ontworpen voor het testen van kleine gegevenssets met minder dan 100 rijen. Voor gebruiksvoorbeelden met meer dan 100 rijen gegevens raadt Databricks aan om
ai_query
en een ingerichte doorvoereindpunt te gebruiken. Zie Voer batch LLM-afleiding uit met behulp van ai_query.
Met de functie ai_summarize()
kunt u een state-of-the-art AI-model aanroepen om een samenvatting van een bepaalde tekst te genereren met behulp van SQL. Deze functie maakt gebruik van een chatmodel voor eindpunten dat beschikbaar wordt gesteld door Databricks Foundation Model-API's.
Vereisten
Belangrijk
De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie, Copyright © The Apache Software Foundation of de LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.
Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als modellen in de toekomst beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de lijst met toepasselijke licenties op deze pagina) wijzigen.
Momenteel is Meta-Llama-3.1-70B-Instruct het onderliggende model dat deze AI-functies mogelijk maakt.
- Deze functie is alleen beschikbaar voor werkruimten in AI Functions met behulp van ondersteunde regio's voor Foundation-model-API's.
- Deze functie is niet beschikbaar in Azure Databricks SQL Classic.
- Controleer de pagina met prijzen voor Databricks SQL.
Notitie
In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.
Syntaxis
ai_summarize(content[, max_words])
Argumenten
-
content
: EenSTRING
expressie, de tekst die moet worden samengevat. -
max_words
: Een optionele niet-negatieve integrale numerieke expressie die het best effort-doelaantal woorden in de geretourneerde samenvattingstekst vertegenwoordigt. De standaardwaarde is 50. Als deze optie is ingesteld op 0, is er geen woordlimiet.
Retouren
A STRING
.
Als content
dat het is NULL
, is NULL
het resultaat .
Voorbeelden
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."