Azure AI 검색의 기능
Azure AI 검색은 정보 검색 기능을 제공하고 선택적 AI 통합을 사용하여 텍스트 및 벡터 콘텐츠에서 더 많은 가치를 추출합니다.
다음 표에는 범주별로 해당 기능이 요약되어 있습니다. Azure AI 검색을 다른 검색 기술과 비교하는 방법에 대한 자세한 내용은 검색 옵션 비교를 참조하세요.
모든 Azure 퍼블릭, 프라이빗 및 소버린 클라우드에는 기능 패리티가 있지만 일부 기능은 특정 Azure 지역에서 지원되지 않습니다. 자세한 내용은 지역 선택을 참조하세요.
참고 항목
미리 보기 기능을 찾고 계신가요? 미리 보기 기능 목록을 참조하세요.
인덱싱 기능
범주 | 기능 |
---|---|
데이터 원본 | JSON 문서로 제출된 경우 검색 인덱스에서 모든 원본의 텍스트를 허용할 수 있습니다. 인덱서는 지원되는 데이터 원본에서 데이터 가져오기를 자동화하여 기본 데이터 저장소에서 검색 가능한 콘텐츠를 추출하는 기능입니다. 인덱서는 JSON serialization을 처리하며 대부분은 일부 형태의 변경 및 삭제 검색을 지원합니다. OneLake, Azure SQL Database, Azure Cosmos DB 또는 Azure Blob storage를 비롯한 다양한 데이터 원본에 연결할 수 있습니다. |
계층형 및 중첩 데이터 구조 | 복합 형식 및 컬렉션을 사용하면 거의 모든 유형의 JSON 구조를 검색 인덱스로 모델링할 수 있습니다. 일대다 및 다대다 카디널리티는 컬렉션, 복합 형식 및 복합 형식 컬렉션을 통해 고유하게 표현할 수 있습니다. |
언어 분석 | 분석기는 인덱싱 및 검색 작업 중 텍스트 처리에 사용되는 구성 요소입니다. 기본적으로, 범용 표준 Lucene 분석기를 사용하거나, 언어 분석기, 구성한 사용자 지정 분석기 또는 필요한 형식으로 토큰을 생성하는 미리 정의된 다른 분석기를 사용하여 기본값을 재정의할 수 있습니다. Lucene 또는 Microsoft의 언어 분석기는 동사 시제, 성, 불규칙 복수 명사(예: ‘mouse’와 ‘mice’), 단어 분해, 단어 분철(띄어쓰기가 없는 언어의 경우) 등을 비롯한 언어별 언어 체계를 지능적으로 처리할 수 있습니다. 사용자 지정 어휘 분석기는 표기 일치 및 정규식을 사용하는 복잡한 검색 쿼리에 사용됩니다. |
벡터 및 하이브리드 검색
범주 | 기능 |
---|---|
벡터 인덱싱 | 검색 인덱스 내에서 벡터 필드를 추가하여 벡터 검색 시나리오를 지원합니다. 벡터 필드는 동일한 검색 문서의 비벡터 필드와 공존할 수 있습니다. |
벡터 쿼리 | 단일 및 복수 벡터 쿼리를 작성합니다. |
벡터 검색 알고리즘 | 검색 인덱스에서 유사한 벡터를 찾으려면 HNSW(Hierarchical Navigable Small World)를 사용하거나 완전 KNN(K-Nearest Neighbors)을 사용합니다. |
벡터 필터 | 정보 검색 시 정밀도를 높이기 위해 쿼리 실행 전후에 필터를 적용합니다. |
하이브리드 정보 검색 | 단일 하이브리드 쿼리 요청 개념 및 키워드를 검색합니다. 하이브리드 검색은 최상의 결과를 위해 선택적 의미 체계 순위 지정 및 관련성 튜닝과 함께 벡터 및 텍스트 검색을 통합합니다. |
통합 데이터 청킹 및 벡터화 | 텍스트 분할 기술을 통한 원시 데이터 청크. 벡터라이저를 통한 원시 벡터화 및 AzureOpenAIEmbeddingModel, Azure AI Vision 다중 모달, AML 기술 등 Azure AI Studio 모델 카탈로그의 엔드포인트에 연결할 때 사용할 수 있는 포함된 기술. 통합된 벡터화는 원본 파일에서 쿼리로 엔드투엔드 인덱싱 파이프라인을 제공합니다. |
통합 벡터 압축 및 양자화 | 기본 제공 스칼라 및 이진 양자화를 사용하여 메모리 및 디스크에서 벡터 인덱스 크기를 줄입니다. 필요하지 않은 벡터의 스토리지를 포기하거나 스토리지 요구 사항을 줄이기 위해 벡터 필드에 좁은 데이터 형식을 할당할 수도 있습니다. |
응용 AI 및 정보 마이닝
범주 | 기능 |
---|---|
인덱싱 중 AI 처리 | AI 보강은 전체 텍스트 검색을 위해 인덱싱할 수 없는 콘텐츠에서 텍스트 및 정보를 추출하는 인덱서 파이프라인에 포함된 이미지 및 자연어 처리를 나타냅니다. AI 처리는 기술 세트에서 기술을 추가하고 결합한 다음 인덱서에 연결하여 수행됩니다. AI는 텍스트 번역이나 OCR(광학 문자 인식)과 같은 기본 제공 기술이나 사용자가 제공하는 사용자 지정 기술일 수 있습니다. |
비검색 시나리오에서 분석하고 사용할 수 있도록 보강된 콘텐츠 저장 | 지식 저장소는 지식 마이닝 및 데이터 과학 처리와 같은 비검색 시나리오를 위한 보강된 콘텐츠의 영구적 스토리지입니다. 지식 저장소는 기술 세트에 정의되어 있지만 Azure Storage에서 개체 또는 테이블 형식 행 집합으로 만들어집니다. |
캐시된 보강 | 보강 캐싱(미리 보기)은 기술 세트 실행 중에 다시 사용할 수 있는 캐시된 보강을 나타냅니다. 캐싱은 처리 비용이 많이 드는 OCR 및 이미지 분석을 포함하는 기술 세트에서 특히 유용합니다. |
전체 텍스트 및 기타 쿼리 양식
범주 | 기능 |
---|---|
자유 형식 텍스트 검색 | 전체 텍스트 검색은 대부분의 검색 기반 앱에서 기본적으로 사용되는 검색 방식입니다. 쿼리는 지원되는 구문을 사용하여 작성할 수 있습니다. 간단한 쿼리 구문은 논리 연산자, 구 검색 연산자, 후위 연산자, 선행 연산자를 제공합니다. 전체 Lucene 쿼리 구문에는 간단한 구문의 모든 연산이 포함되며 유사 항목 검색, 근접 검색, 용어 상승 및 정규식에 대한 확장이 포함됩니다. |
정확도 | 간단한 점수 매기기는 Azure AI Search의 핵심적인 장점입니다. 점수 매기기 프로필은 문서 자체의 값에 대한 함수로서 관련성을 모델링하는 데 사용됩니다. 예를 들어 최신 제품 또는 할인 제품을 검색 결과의 더 높은 부분에 나타내려고 할 수 있습니다. 또한 따로 추적하고 저장한 고객 검색 기본 설정에 따라 개인화된 점수에 태그를 사용하여 점수 매기기 프로필을 만들 수도 있습니다. 의미 순위매기기(미리 보기)는 쿼리에 대한 의미 체계 관련성에 따라 결과 순위를 재조정하는 프리미엄 기능입니다. 콘텐츠 및 시나리오에 따라 거의 최소한의 구성이나 노력으로 검색 관련성을 크게 향상시킬 수 있습니다. |
지리 공간적 검색 | 지리 공간적 함수는 지리적 좌표를 필터링하고 일치시킵니다. 거리를 일치시키거나 다각형 도형에 포함하여 일치시킬 수 있습니다. |
필터 및 패싯 | 패싯 탐색은 단일 쿼리 매개 변수를 통해 사용하도록 설정됩니다. Azure AI 검색은 자기 주도형 필터링(예: 가격 범위 또는 브랜드별로 카탈로그 항목 필터링)을 위해 코드 숨김 카탈로그 목록으로 사용할 수 있는 패싯 탐색 구조를 반환합니다. 필터를 사용하여 패싯 탐색을 애플리케이션 UI에 통합하고, 쿼리 작성을 향상하고, 사용자 또는 개발자가 지정한 기준에 따라 필터링할 수 있습니다. OData 구문을 사용하여 필터를 만듭니다. |
사용자 환경 | 자동 완성은 검색 창의 자동 완성 쿼리에 사용할 수 있습니다. 검색 제안 도 검색 표시줄 결과에서 일부 텍스트 입력에서 작동에 실제 문서 쿼리를 사용 하지 않고 인덱스 사용 약관이 있습니다. 동의어는 사용자가 대체 용어를 제공할 필요 없이 쿼리의 범위를 암시적으로 확장하는 동등한 용어를 연결합니다. 적중 항목 강조 표시는 검색 결과의 일치하는 키워드에 텍스트 서식을 적용합니다. 강조 표시된 조각을 반환할 필드를 선택할 수 있습니다. 정렬은 인덱스 스키마를 통해 여러 필드에 제공된 후 쿼리 시 단일 검색 매개 변수를 통해 전환됩니다. 검색 결과 페이징 및 제한은 Azure AI 검색에서 검색 결과에 대해 제공하는 세밀하게 조정된 컨트롤을 사용하여 손쉽게 적용할 수 있습니다. |
보안 기능
범주 | 기능 |
---|---|
데이터 암호화 | Microsoft 관리형 저장 데이터 암호화는 내부 스토리지 레이어에 내장되어 있으며 취소할 수 없습니다. Azure Key Vault에서 만들고 관리하는 고객 관리형 암호화 키는 인덱스 및 동의어 맵의 보충 암호화에 사용할 수 있습니다. 2020년 8월 1일 이후에 만들어진 서비스의 경우 CMK 암호화는 인덱싱된 콘텐츠의 전체 이중 암호화를 위해 임시 디스크의 데이터까지 확장됩니다. |
엔드포인트 보호 | 인바운드 방화벽 지원을 위한 IP 규칙을 사용하면 검색 서비스에서 요청을 수락하는 IP 범위를 설정할 수 있습니다. Azure 프라이빗 링크를 사용하여 프라이빗 엔드포인트를 만들어 가상 네트워크를 통해 모든 요청을 강제로 적용합니다. |
인바운드 액세스 | 역할 기반 액세스 제어는 검색 콘텐츠 및 작업에 대한 제어된 액세스를 위해 Microsoft Entra ID의 사용자 및 그룹에 역할을 할당합니다. 역할 할당을 사용하지 않으려면 키 기반 인증을 사용할 수도 있습니다. |
아웃바운드 보안(인덱서) | 프라이빗 엔드포인트를 통한 데이터 액세스를 사용하면 인덱서에서 Azure Private Link를 통해 보호되는 Azure 리소스에 연결할 수 있습니다. 신뢰할 수 있는 ID를 사용하는 데이터 액세스는 외부 데이터 원본에 대한 연결 문자열에서 사용자 이름과 암호를 생략할 수 있음을 의미합니다. 인덱서가 데이터 원본에 연결되면 검색 서비스가 이전에 신뢰할 수 있는 서비스로 등록된 경우 리소스에서 연결을 허용합니다. |
포털 기능
범주 | 기능 |
---|---|
프로토타입 및 검사용 도구 | 인덱스 추가는 특성 사용 필드와 몇 가지 다른 설정으로 구성된 기본 스키마를 만드는 데 사용할 수 있는 포털의 인덱스 디자이너입니다. 인덱스를 저장한 후에는 SDK 또는 REST API를 사용하여 데이터를 제공하는 방법으로 작성할 수 있습니다. 데이터 가져오기 마법사는 인덱스, 인덱서, 기술 세트와 데이터 원본 정의를 만듭니다. 데이터가 Azure에 있는 경우, 이 마법사는 특히 개념 증명 조사 및 탐색에 대해 상당한 시간과 노력을 절감할 수 있습니다. 데이터 가져오기 및 벡터화는 데이터 청킹 및 벡터화가 포함된 전체 인덱싱 파이프라인을 만듭니다. 마법사는 모든 개체 및 구성 설정을 만듭니다. 검색 탐색기는 쿼리를 테스트하고 점수 매기기 프로필을 구체화하는 데 사용됩니다. 데모 앱 만들기는 검색 환경을 테스트하는 데 사용할 수 있는 HTML 페이지를 생성하는 데 사용됩니다. 디버그 세션은 대화형으로 기술 세트를 디버그할 수 있는 시각적 편집기입니다. 이것은 종속성, 출력 및 변환을 보여 줍니다. |
모니터링 및 진단 | 포털에 항상 표시되는 단순한 메트릭 이상을 원하신다면 모니터링 기능을 사용하세요. 필요한 추가 구성 없이 포털 페이지에서 초당 쿼리 수, 대기 시간 및 제한에 대한 메트릭이 캡처되고 보고됩니다. |
프로그래밍 기능
범주 | 기능 |
---|---|
REST (영문) | 서비스 REST API는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다. 관리 REST API는 서비스를 만들고 Azure Resource Manager를 통해 프로비전하는 데 사용할 수 있습니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다. |
Azure SDK for .NET | Azure.Search.Documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다. Microsoft.Azure.Management.Search는 서비스를 만들고 Azure Resource Manager를 통해 프로비전하는 데 사용할 수 있습니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다. |
Java용 Azure SDK | com.azure.search.documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다. com.microsoft.azure.management.search는 서비스를 만들고 Azure Resource Manager를 통해 프로비전하는 데 사용할 수 있습니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다. |
Python용 Azure SDK | azure-search-documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다. azure-mgmt-search는 서비스를 만들고 Azure Resource Manager를 통해 프로비전하는 데 사용합니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다. |
JavaScript/TypeScript용 Azure SDK | azure/search-documents는 인덱싱, 쿼리 및 AI 보강에 관련된 모든 작업을 포함한 데이터 평면 작업에 사용합니다. 또한 이 클라이언트 라이브러리를 사용하여 시스템 정보와 통계를 검색할 수 있습니다. azure/arm-search는 서비스를 만들고 Azure Resource Manager를 통해 프로비전하는 데 사용합니다. 이 API를 사용하여 키 및 용량을 관리할 수도 있습니다. |