ai_summarize
函式
適用於:Databricks SQL
Databricks Runtime
重要
這項功能處於公開預覽狀態。
在預覽中:
- 基礎語言模型可以處理數種語言,不過這些函數會針對英文進行調整。
- 基礎的 Foundation Model API 有速率限制。 請參閱 基礎模型 API 的限制,其中 到 update 為這些限制的範圍。
- 由於速率限制,此函式是針對小於100個數據列的小型數據集進行測試所設計。 針對具有超過 100 個資料列的使用案例,Databricks 建議使用
ai_query
和已配置的輸送量端點。 請參閱 使用 ai_query執行批次 LLM 推斷。
ai_summarize()
函式可讓您調用最先進的生成型 AI 模型,使用 SQL 來 generate 指定文字的摘要。 此函數會使用 Databricks Foundation Model API 所提供之端點的聊天模型。
需求
重要
目前可能使用的基礎模型會根據 Apache 2.0授權、著作權© Apache Software Foundation 或 LLAMA 3.1社群授權著作權©中繼平臺公司進行授權 。保留所有權利。 客戶應負責確保遵循適用的模型授權。
Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果未來有模型在 Databricks 的內部基準檢驗中表現更佳,Databricks 可能會變更模型(以及此頁面上提供的適用授權 list)。
目前, Meta-Llama-3.1-70B-指示 是支持這些 AI 函式的基礎模型。
- 此函數僅適用於使用 Foundation Model API 支援區域之 AI 函數中的工作區。
- 此函數不適用於 Azure Databricks SQL Classic。
- 查看 Databricks SQL 定價頁面。
注意
在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本支援此函數,包括在 Databricks 工作流程中作為任務執行的筆記本。
語法
ai_summarize(content[, max_words])
引數
-
content
:STRING
運算式,要摘要的文字。 -
max_words
:選用的非負整數數值運算式,代表傳回之摘要文字中最佳的目標字數。 預設值為 50。 如果 set 是 0,則不存在字 limit。
傳回
STRING
。
如果 content
是 NULL
,結果就是 NULL
。
範例
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."