Função ai_similarity
Aplica-se a: Databricks SQL Databricks Runtime
Importante
Esta funcionalidade está em Pré-visualização Pública.
Na pré-visualização:
- O modelo de linguagem subjacente pode lidar com vários idiomas, no entanto, essas funções são ajustadas para o inglês.
- Há limite de taxa para as APIs subjacentes do Modelo de Base. Consulte Limites das APIs do Modelo de Base para atualizar esses limites.
A ai_similarity()
função invoca um modelo de IA generativa de última geração das APIs do Databricks Foundation Model para comparar duas cadeias de caracteres e calcula a pontuação de semelhança semântica usando SQL.
Requisitos
Importante
Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License Copyright Meta © Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.
A Databricks recomenda a revisão dessas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os benchmarks internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).
Atualmente, GTE Large (Inglês) é o modelo subjacente que alimenta esta função de IA.
- Esta função só está disponível em espaços de trabalho em AI Functions usando regiões suportadas por APIs do Foundation Model.
- Esta função não está disponível no Azure Databricks SQL Classic.
- Verifique a página de preços do Databricks SQL.
Nota
No Databricks Runtime 15.1 e superior, essa função é suportada em blocos de anotações Databricks, incluindo blocos de anotações que são executados como uma tarefa em um fluxo de trabalho Databricks.
Sintaxe
ai_similarity(expr1, expr2)
Argumentos
expr1
: UmaSTRING
expressão.expr2
: UmaSTRING
expressão.
Devoluções
Um FLOAT
valor, que representa a semelhança semântica entre as duas cadeias de entrada. A pontuação de saída é relativa e só deve ser usada para classificação. Pontuação de 1 significa que os dois textos são iguais.
Exemplos
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.