Funktionen ai_summarize
Gäller för: Databricks SQL Databricks Runtime
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
I förhandsversionen:
- Den underliggande språkmodellen kan hantera flera språk, men dessa funktioner är anpassade för engelska.
- Det finns hastighetsbegränsning för de underliggande FOUNDATION Model-API:erna. Se gränserna för Foundation Model API:er från till update.
- På grund av hastighetsbegränsning är den här funktionen utformad för testning på små datauppsättningar som har mindre än 100 rader. För användningsfall med över 100 rader data rekommenderar Databricks att du använder
ai_query
och en etablerad dataflödesslutpunkt. Se Utföra batch-LLM-slutsatsdragning med hjälp av ai_query.
Med funktionen ai_summarize()
kan du anropa en toppmodern generativ AI-modell för att generate en sammanfattning av en viss text med hjälp av SQL. Den här funktionen använder en chattmodell som betjänar slutpunkten som görs tillgänglig av Databricks Foundation-modell-API:er.
Krav
Viktigt!
De underliggande modeller som kan användas just nu är licensierade under Apache 2.0-licensen, Copyright © Apache Software Foundation eller LLAMA 3.1 Community License Copyright © Meta Platforms, Inc. Alla rättigheter reserverade. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser.
Databricks rekommenderar att du granskar dessa licenser för att säkerställa efterlevnad av tillämpliga villkor. Om modeller dyker upp i framtiden som presterar bättre enligt Databricks interna riktmärken kan Databricks ändra modellen (och list av tillämpliga licenser som tillhandahålls på den här sidan).
För närvarande är Meta-Llama-3.1-70B-Instruct den underliggande modellen som driver dessa AI-funktioner.
- Den här funktionen är endast tillgänglig på arbetsytor i AI Functions med hjälp av FOUNDATION Model API:er som stöds.
- Den här funktionen är inte tillgänglig i Azure Databricks SQL Classic.
- Kontrollera prissättningssidan för Databricks SQL.
Kommentar
I Databricks Runtime 15.1 och senare stöds den här funktionen i Databricks Notebooks, inklusive notebook-filer som körs som en uppgift i ett Databricks-arbetsflöde.
Syntax
ai_summarize(content[, max_words])
Argument
-
content
: EttSTRING
uttryck, texten som ska sammanfattas. -
max_words
: Ett valfritt icke-negativt, numeriskt uttryck som representerar det bästa målantalet ord i den returnerade sammanfattningstexten. Standardvärdet är 50. Om set är 0 finns det inget ord limit.
Returer
En STRING
.
Om content
är NULL
är NULL
resultatet .
Exempel
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."