`ai_similarity` 함수

아티클
01/23/2025

적용 대상: 예로 표시된 확인 Databricks SQL Databricks Runtime

Important

이 기능은 공개 미리 보기 상태입니다.

미리 보기에서:

기본 언어 모델은 여러 언어를 처리할 수 있지만 이러한 함수는 영어로 조정됩니다.
기본 Foundation Model API에 대한 속도 제한이 있습니다. 이러한 제한을 업데이트하려면 Foundation Model API 제한을 참조하세요.
속도 제한으로 인해 이 함수는 행이 100개 미만인 작은 데이터 세트를 테스트하도록 설계되었습니다. 데이터 행이 100개가 넘는 사용 사례의 경우 Databricks는 ai_query 및 프로비전된 처리량 엔드포인트를 사용하는 것이 좋습니다. ai_query사용하여 일괄 LLM 추론 수행 참조하세요.

ai_similarity() 함수는 Databricks Foundation 모델 API에서 최신 생성 AI 모델을 호출하여 두 문자열을 비교하고 SQL을 사용하여 의미 체계 유사성 점수를 계산합니다.

요구 사항

Important

현재 사용할 수 있는 기본 모델은 Apache 2.0 라이선스, Copyright © The Apache Software Foundation 또는 LLAMA 3.1 Community License Copyright © Meta Platforms, Inc.에 따라 라이선스가 부여됩니다. 모든 권한이 예약되어 있습니다. 고객은 해당 모델 라이선스를 준수할 책임이 있습니다.

Databricks는 해당 조건을 준수하도록 이러한 라이선스를 검토할 것을 권장합니다. Databricks의 내부 벤치마크에 따라 더 나은 성능을 제공하는 모델이 향후에 나타날 경우 Databricks는 모델(및 이 페이지에 제공된 해당 라이선스 목록)을 변경할 수 있습니다.

현재 GTE Large(영어) 는 이 AI 기능을 지원하는 기본 모델입니다.

이 함수는 Foundation Model API 지원 지역을 사용하여 AI Functions의 작업 영역에서 만 사용할 수 있습니다.
이 기능은 Azure Databricks SQL 클래식에서는 사용할 수 없습니다.
Databricks SQL 가격 페이지를 확인하세요.

참고 항목

Databricks Runtime 15.1 이상에서 이 함수는 Databricks 워크플로에서 태스크로 실행되는Notebooks를 포함하여 Databricks Notebooks에서 지원됩니다.

구문

ai_similarity(expr1, expr2)

인수

expr1: STRING 식입니다.
expr2: STRING 식입니다.

반품

두 입력 문자열 간의 의미적 유사성을 나타내는 FLOAT 값입니다. 출력 점수는 상대적이며 순위에만 사용해야 합니다. 점수가 1이면 두 텍스트가 같습니다.

예

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 10;

  Databricks Inc.

다음을 통해 공유

`ai_similarity` 함수

요구 사항

구문

인수

반품

예

피드백

추가 리소스

다음을 통해 공유

ai_similarity 함수

요구 사항

구문

인수

반품

예

피드백

추가 리소스

`ai_similarity` 함수