series_cosine_similarity()
적용 대상: ✅Microsoft Fabric✅✅
두 숫자 벡터의 코사인 유사성을 계산합니다.
이 함수 series_cosine_similarity()
는 두 개의 숫자 계열을 입력으로 사용하고 코사인 유사성을 계산합니다.
구문
series_cosine_similarity(
series1,
series2, [
*magnitude1, [
*magnitude2]])
구문 규칙에 대해 자세히 알아봅니다.
매개 변수
이름 | Type | 필수 | 설명 |
---|---|---|---|
series1, series2 | dynamic |
✔️ | 숫자 데이터가 있는 입력 배열입니다. |
magnitude1, magnitude2 | real |
각각 첫 번째 및 두 번째 벡터의 선택적 크기입니다. 크기는 벡터 자체의 점 곱의 제곱근입니다. 크기가 제공되지 않으면 계산됩니다. |
반품
series2와 series1real
의 코사인 유사성 값이 있는 형식 의 값을 반환합니다.
두 계열 길이가 같지 않은 경우 긴 계열은 더 짧은 계열의 길이로 잘립니다.
입력 계열의 숫자가 아닌 요소는 무시됩니다.
참고 항목
하나 또는 두 입력 배열이 모두 비어 있으면 결과는 다음과 같습니다 null
.
성능 최적화
이 함수를 사용할 때 성능이 향상되고 스토리지 요구 사항이 감소하려면 ML 벡터 포함과 같이 64비트 정밀도가 필요하지 않은 부동 소수점 벡터를 저장하기 위한 인코딩 정책을 사용하는 Vector16
것이 좋습니다. Bfloat16Vector16
프로필은 작업을 크게 최적화하고 스토리지 크기를 4단계로 줄일 수 있습니다. 인코딩 정책에 대한 Vector16
자세한 내용은 인코딩 정책 유형을 참조 하세요.
예시
datatable(s1:dynamic, s2:dynamic)
[
dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)
s1 | s2 | cosine_similarity |
---|---|---|
[0.1,0.2,0.1,0.2] | [0.11,0.2,0.11,0.21] | 0.99935343825504 |
[0.1,0.2,0.1,0.2] | [1,2,3,4] | 0.923760430703401 |