ai_similarity
函式
適用於:Databricks SQL
Databricks Runtime
重要
這項功能處於公開預覽狀態。
在預覽中:
- 基礎語言模型可以處理數種語言,不過這些函數會針對英文進行調整。
- 基礎的 Foundation Model API 有速率限制。 請參閱 基礎模型 API 限制 更新這些限制。
- 保守的預設速率限制會套用至此函式。 如需高輸送量應用程式,請連絡支持人員。
ai_similarity()
函數會從 Databricks Foundation Model API 叫用最先進的生成式 AI 模型,以比較兩個字串,並使用 SQL 計算語意相似度分數。
需求
重要
目前可能使用的基礎模型是依據 Apache 2.0 授權,著作權屬於 Apache Software Foundation 或 LLAMA 3.3 社群授權,Copyright © Meta Platforms, Inc. 保留所有權利。 客戶應負責確保遵循適用的模型授權。
Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果未來模型根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面上提供的適用授權清單)。
- 此函數僅適用於使用 Foundation Model API 支援區域之 AI 函數中的工作區。
- 此函數不適用於 Azure Databricks SQL Classic。
- 查看 Databricks SQL 定價頁面。
注意
在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本支援此函數,包括在 Databricks 工作流程中作為任務執行的筆記本。
語法
ai_similarity(expr1, expr2)
引數
-
expr1
:STRING
運算式。 -
expr2
:STRING
運算式。
退貨
FLOAT
值,表示兩個輸入字串之間的語意相似性。 輸出分數是相對的,而且應該只用於排名。 分數 1 表示兩個文字相等。
範例
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 10;
Databricks Inc.