ai_classify
함수
적용 대상: Databricks SQL Databricks Runtime
Important
이 기능은 공개 미리 보기 상태입니다.
미리 보기에서:
- 기본 언어 모델은 여러 언어를 처리할 수 있지만 이러한 함수는 영어로 조정됩니다.
- 기본 Foundation Model API에 대한 속도 제한이 있습니다. 파운데이션 모델 API의 제한 사항은부터 update까지 참조하세요.
- 속도 제한으로 인해 이 함수는 행이 100개 미만인 작은 데이터 세트를 테스트하도록 설계되었습니다. 데이터 행이 100개가 넘는 사용 사례의 경우 Databricks는
ai_query
및 프로비전된 처리량 엔드포인트를 사용하는 것이 좋습니다. ai_query사용하여 LLM 일괄 유추 수행을 참조하세요.
이 ai_classify()
함수를 사용하면 최신 생성 AI 모델을 호출하여 SQL을 사용하여 제공하는 레이블에 따라 입력 텍스트를 분류할 수 있습니다. 이 함수는 Databricks Foundation 모델 API에서 사용할 수 있는 엔드포인트를 제공하는 채팅 모델을 사용합니다.
요구 사항
Important
현재 사용할 수 있는 기본 모델은 Apache 2.0 라이선스, Copyright © The Apache Software Foundation 또는 LLAMA 3.1 Community License Copyright © Meta Platforms, Inc.에 따라 라이선스가 부여됩니다. 모든 권한이 예약되어 있습니다. 고객은 해당 모델 라이선스를 준수할 책임이 있습니다.
Databricks는 해당 조건을 준수하도록 이러한 라이선스를 검토할 것을 권장합니다. Databricks의 내부 벤치마크에 따라 더 나은 성능을 제공하는 모델이 미래에 등장하면 Databricks는 모델(및 이 페이지에 제공된 해당 라이선스의 list)을 변경할 수 있습니다.
현재 Meta-Llama-3.1-70B-Instruct 는 이러한 AI 기능을 지원하는 기본 모델입니다.
- 이 함수는 Foundation Model API 지원 지역을 사용하여 AI Functions의 작업 영역에서 만 사용할 수 있습니다.
- 이 기능은 Azure Databricks SQL 클래식에서는 사용할 수 없습니다.
- Databricks SQL 가격 페이지를 확인하세요.
참고 항목
Databricks Runtime 15.1 이상에서 이 함수는 Databricks 워크플로에서 태스크로 실행되는Notebooks를 포함하여 Databricks Notebooks에서 지원됩니다.
구문
ai_classify(content, labels)
인수
-
content
: 분류할 텍스트인STRING
표현식입니다. -
labels
: 예상 출력 분류 레이블인ARRAY<STRING>
리터럴입니다. 2개 이상의 요소와 20개 이하의 요소를 포함해야 합니다.
반품
STRING
. 이 값은 labels
인수에 제공된 문자열 중 하나와 일치합니다.
null
를 분류할 수 없는 경우 content
를 반환합니다.
예제
> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
urgent
> SELECT
description,
ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
FROM
products
LIMIT 10;