Partilhar via


Função ai_similarity

Aplica-se a: Marque Sim Databricks SQL Marque Sim Databricks Runtime

Importante

Esta funcionalidade está em Pré-visualização Pública.

Na pré-visualização:

  • O modelo de linguagem subjacente pode lidar com vários idiomas, no entanto, essas funções são ajustadas para o inglês.
  • Há limite de taxa para as APIs subjacentes do Modelo de Base. Consulte Limites das APIs do Modelo de Base para atualizar esses limites.

A ai_similarity() função invoca um modelo de IA generativa de última geração das APIs do Databricks Foundation Model para comparar duas cadeias de caracteres e calcula a pontuação de semelhança semântica usando SQL.

Requisitos

Importante

Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License Copyright Meta © Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.

A Databricks recomenda a revisão dessas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os benchmarks internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).

Atualmente, GTE Large (Inglês) é o modelo subjacente que alimenta esta função de IA.

  • Esta função só está disponível em espaços de trabalho em AI Functions usando regiões suportadas por APIs do Foundation Model.
  • Esta função não está disponível no Azure Databricks SQL Classic.
  • Verifique a página de preços do Databricks SQL.

Nota

No Databricks Runtime 15.1 e superior, essa função é suportada em blocos de anotações Databricks, incluindo blocos de anotações que são executados como uma tarefa em um fluxo de trabalho Databricks.

Sintaxe

ai_similarity(expr1, expr2)

Argumentos

  • expr1: Uma STRING expressão.
  • expr2: Uma STRING expressão.

Devoluções

Um FLOAT valor, que representa a semelhança semântica entre as duas cadeias de entrada. A pontuação de saída é relativa e só deve ser usada para classificação. Pontuação de 1 significa que os dois textos são iguais.

Exemplos

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.