共用方式為


ai_similarity函式

適用於: 核取記號為「是」Databricks SQL 核取記號為「是」Databricks Runtime

重要

這項功能處於公開預覽狀態

在預覽中:

  • 基礎語言模型可以處理數種語言,不過這些函數會針對英文進行調整。
  • 基礎的 Foundation Model API 有速率限制。 請參閱<Foundation Model API 限制>以更新這些限制。

ai_similarity() 函數會從 Databricks Foundation Model API 叫用最先進的生成式 AI 模型,以比較兩個字串,並使用 SQL 計算語意相似度分數。

需求

重要

目前可能使用的基礎模型會根據 Apache 2.0授權、著作權© Apache Software Foundation 或 LLAMA 3.1社群授權著作權©中繼平臺公司進行授權 。保留所有權利。 客戶應負責確保遵循適用的模型授權。

Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果未來模型根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面上提供的適用授權清單)。

目前, GTE 大型(英文) 是支援此 AI 函式的基礎模型。

注意

在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本支援此函數,包括在 Databricks 工作流程中作為任務執行的筆記本。

語法

ai_similarity(expr1, expr2)

引數

  • expr1STRING 運算式。
  • expr2STRING 運算式。

傳回

FLOAT 值,表示兩個輸入字串之間的語意相似性。 輸出分數是相對的,而且應該只用於排名。 分數 1 表示兩個文字相等。

範例

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.