소개
Azure AI 검색을 사용하면 AI 기술의 파이프라인이 데이터를 보강하고 인덱스를 채우는 데 사용되는 검색 솔루션을 만들 수 있습니다. 파이프라인의 기술에 의해 이루어지는 데이터 보강은 다음과 같은 정보를 사용하여 원본 데이터를 보완합니다.
- 문서 작성에 사용되는 언어
- 문서에서 설명하는 주요 테마 또는 항목을 확인하는 데 도움이 될 수 있는 주요 문구
- 문서를 양수 또는 음수로 수량화하는 감정 점수
- 콘텐츠에 언급된 특정 위치, 사람, 조직 또는 주요 사건
- AI에서 생성된 이미지의 설명 또는 OCR(광학 인식)에서 추출한 이미지 텍스트
인덱스의 보강 데이터를 사용하면 원본 콘텐츠에 대한 기본 전체 텍스트 검색을 능가하는 종합적인 검색 솔루션을 만들 수 있습니다.
지식 저장소
인덱스를 인덱싱 프로세스의 기본 출력으로 고려할 수 있지만 인덱스에 포함된 보강 데이터는 다른 방식으로 유용할 수도 있습니다. 예를 들면 다음과 같습니다.
- 인덱스는 기본적으로 인덱싱된 레코드를 나타내는 JSON 개체의 컬렉션이므로 데이터 오케스트레이션 프로세스에 통합하는 경우 Azure Data Factory와 같은 도구를 사용하여 개체를 JSON 파일로 내보내는 것이 유용할 수 있습니다.
- 분석 및 보고를 위해 Microsoft Power BI와 같은 도구를 사용하여 인덱스 레코드를 테이블의 관계형 스키마로 정규화할 수도 있습니다.
- 인덱싱 프로세스 중에 문서에서 포함된 이미지를 추출하면 해당 이미지를 파일로 저장할 수 있습니다.
Azure AI 검색은 보강 파이프라인을 캡슐화하는 기술 세트를 통해 지식 저장소를 정의할 수 있도록 함으로써 관련 시나리오를 지원합니다. 지식 저장소는 보강 데이터의 프로젝션으로 구성되며, 해당 데이터는 JSON 개체, 테이블 또는 이미지 파일일 수 있습니다. 인덱서는 파이프라인을 실행하여 인덱스를 만들거나 업데이트할 때 지식 저장소에서 프로젝션을 생성하고 유지합니다.
이 모듈에서는 브로셔 및 호텔 검토의 정보를 사용하여 고객의 여행 계획을 돕는 가상 여행사인 Margie's Travel에 대한 지식 저장소를 구현하고, 다음과 같은 방법을 알아봅니다.
- Azure AI 검색 파이프라인에서 지식 저장소 만들기
- 지식 저장소에서 프로젝션 형태의 데이터 보기
참고 항목
이 모듈에서는 기본 제공 기술이 포함된 Azure AI 검색 솔루션을 만들고 사용하는 방법을 이미 알고 있다고 가정합니다. 그렇지 않으면 먼저 Azure AI 검색 솔루션 만들기 모듈을 완료합니다.