벡터 검색이란?

완료됨

벡터 검색은 검색 인덱스에서 벡터 포함을 인덱싱하고 저장하고 검색하는 데 사용되는 AI 검색 기능입니다. 벡터 검색을 사용하여 RAG(검색 증강 생성) 아키텍처, 유사성 및 다중 모달 검색 또는 추천 엔진을 구현하는 애플리케이션을 구동할 수 있습니다.

다음은 벡터 검색을 위한 인덱싱 및 쿼리 워크플로의 그림입니다.

인덱싱 및 쿼리 워크플로 다이어그램.

벡터 쿼리는 기계 학습 모델에서 생성된 콘텐츠의 수학적 표현을 제공하여 다양한 유형의 원본 데이터에 대한 기준을 일치시키는 데 사용할 수 있습니다. 이는 쿼리의 의도를 사용하여 관련 결과를 반환하는 텍스트 기반 검색의 한계를 없애줍니다.

다음은 벡터 검색을 사용해야 하는 몇 가지 시나리오입니다.

  • OpenAI 또는 오픈 소스 모델을 사용하여 텍스트를 인코딩하고 벡터로 인코딩된 쿼리를 사용하여 문서를 검색합니다.
  • 인코딩된 이미지, 텍스트, 비디오 및 오디오 또는 이들의 혼합(다중 모달)에서 유사성 검색을 수행합니다.
  • 다국어 포함 모델을 사용해 다른 언어로 된 문서를 표현하여 어떤 언어로 된 문서든 검색합니다.
  • 벡터 검색이 필드 수준에서 구현될 때 벡터 및 검색 가능한 텍스트 필드에서 검색되는 하이브리드를 빌드합니다. 하나의 응답을 반환하기 위해 결과가 병합됩니다.
  • 텍스트 및 숫자 필드에 필터를 적용하고 이를 쿼리에 포함시켜 벡터 검색에서 처리해야 하는 데이터를 줄입니다.
  • 외부 기술 자료를 제공하거나 장기 메모리로 사용하기 위해 벡터 데이터베이스를 만듭니다.

제한 사항

벡터 검색을 사용하는 경우 다음과 같은 몇 가지 제한 사항을 염두에 둬야 합니다.

  • Azure AI 검색에서는 콘텐츠에 대해 포함을 생성하지 않으므로 Azure OpenAI 또는 유사한 오픈 소스 솔루션을 사용하여 포함을 제공해야 합니다.
  • CMK(고객 관리형 키)는 지원되지 않습니다.
  • 적용 가능한 저장 한도가 있으므로 본인의 서비스 할당량에서 제공하는 내용을 확인해야 합니다.

참고 항목

문서가 큰 경우 청크 분할을 고려합니다. 자세한 내용은 AI 검색의 벡터 검색 솔루션을 위한 대용량 설명서 청크 설명서를 참조합니다.