인덱싱 중 추가 처리를 위한 기술(Azure AI 검색)
이 문서에서는 외부 처리에 액세스하기 위해 기술 세트에 포함할 수 있는 Azure AI 검색의 기술을 설명합니다.
기술은 어떤 방식으로든 콘텐츠를 변환하는 원자성 작업을 제공합니다. 텍스트를 인식하거나 추출하는 작업인 경우가 많지만 이미 만들어진 보강을 변형하는 유틸리티 기술일 수도 있습니다. 일반적으로 출력은 텍스트 기반이므로 전체 텍스트 검색 또는 벡터 검색에 사용되는 벡터에 사용할 수 있습니다.
기술은 다음과 같은 범주로 구성됩니다.
기본 제공 기술은 입력, 출력 및 처리 단계를 잘 이해할 수 있는 Azure AI 리소스에 대한 API 호출을 래핑합니다. Azure AI 리소스를 호출하는 기술의 경우 내부 네트워크를 통해 연결됩니다. Azure OpenAI를 호출하는 기술의 경우 검색 서비스가 리소스에 연결하는 데 사용하는 연결 정보를 제공합니다. 소량의 처리는 비용이 청구되지 않지만 대량 처리에는 비용이 청구됩니다. 기본 제공 기술은 Microsoft에서 미리 학습된 모델을 기반으로 하기 때문에 사용자 고유의 학습 데이터를 사용하여 모델을 학습시킬 수 없습니다.
사용자 지정 기술은 검색 서비스 외부에서 실행되는 사용자 지정 코드를 제공합니다. URI를 통해 액세스됩니다. 사용자 지정 코드는 종종 Azure 함수 앱을 통해 사용할 수 있습니다. 오픈 소스 또는 타사 벡터화 모델을 연결하려면 사용자 지정 기술을 사용합니다.
유틸리티는 Azure AI 검색 내부에 있으며 외부 리소스나 아웃바운드 연결에 종속되지 않습니다. 대부분의 유틸리티는 청구할 수 없습니다.
Azure AI 리소스 기술
Azure AI를 호출하는 기술은 AI 서비스 리소스 연결 시 종량제 요금으로 청구됩니다.
OData 형식 | 설명 | 요금제 기준 |
---|---|---|
Microsoft.Skills.Text.CustomEntityLookupSkill | 사용자 지정 사용자 정의 목록에서 텍스트를 찾습니다. | Azure AI 검색(가격 책정) |
Microsoft.Skills.Text.KeyPhraseExtractionSkill | 이 기술은 미리 학습된 모델을 통해 용어 배치, 언어 규칙, 다른 용어에 대한 근접성 및 원본 데이터 내에서 용어가 비정상적인 정도에 따라 중요한 문구를 검색합니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Text.LanguageDetectionSkill | 이 기술은 미리 학습된 모델을 통해 사용되는 언어를 검색합니다(문서당 언어 ID 1개). 동일한 텍스트 세그먼트 내에서 여러 언어가 사용되는 경우 주로 사용된 언어의 LCID가 출력됩니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Text.V3.EntityLinkingSkill | 이 기술은 미리 학습된 모델을 사용하여 Wikipedia의 문서에 대해 인식된 엔터티에 대한 링크를 생성합니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Text.V3.EntityRecognitionSkill | 이 기술은 미리 학습된 모델을 사용해 고정된 범주 집합("Person" , "Location" , "Organization" , "Quantity" , "DateTime" , "URL" , "Email" , "PersonType" , "Event" , "Product" , "Skill" , "Address" , "Phone Number" 및 "IP Address" 필드)에 대한 엔터티를 설정합니다. |
Azure AI 서비스(가격 책정) |
Microsoft.Skills.Text.PIIDetectionSkill | 이 기술은 미리 학습된 모델을 사용하여 지정된 텍스트에서 개인 정보를 추출합니다. 또한 이 기술은 검색된 개인 정보 엔터티를 텍스트에서 마스킹하기 위한 다양한 옵션을 제공합니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Text.V3.SentimentSkill | 이 기술은 미리 학습된 모델을 사용하여 레코드별 기준으로 문장 및 문서 수준에서 서비스를 통해 찾은 가장 높은 신뢰도 점수에 따라 감정 레이블(예: "부정", "중립" 및 "긍정")을 할당합니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Text.TranslationSkill | 이 기술은 미리 학습된 모델을 사용하여 정규화 또는 지역화 사용 사례를 위해 입력 텍스트를 다양한 언어로 번역합니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Vision.ImageAnalysisSkill | 이 기술은 이미지 검색 알고리즘을 사용하여 이미지의 콘텐츠를 식별하고 텍스트 설명을 생성합니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Vision.OcrSkill | 광학 문자 인식 | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Vision.VectorizeSkill | 다중 모드 이미지 및 텍스트 벡터화입니다. | Azure AI 서비스(가격 책정) |
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill | 문서에서 정보 추출을 가속화합니다. | Azure AI 서비스(가격 책정) |
Azure OpenAI 기술
Azure OpenAI에 배포된 모델을 호출하는 기술은 종량제 요금으로 청구됩니다.
OData 형식 | 설명 | 요금제 기준 |
---|---|---|
Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill | 통합 벡터화를 위해 Azure OpenAI의 배포된 포함 모델에 연결합니다. | Azure OpenAI(가격 책정) |
유틸리티 기술
Azure AI 검색에서만 실행되고 보강 캐시의 노드에서 주로 반복되며 대부분은 청구되지 않습니다.
OData 형식 | 설명 | 요금제 기준 |
---|---|---|
Microsoft.Skills.Util.ConditionalSkill | 조건을 기준으로 필터링, 기본값 할당 및 데이터 병합을 허용합니다. | 해당 없음 |
Microsoft.Skills.Util.DocumentExtractionSkill | 보강 파이프라인 내 파일에서 콘텐츠를 추출합니다. | 이미지 추출을 위한 Azure AI 검색(가격 책정) |
Microsoft.Skills.Text.MergeSkill | 필드 컬렉션에서 단일 필드로 텍스트를 통합합니다. | 해당 없음 |
Microsoft.Skills.Util.ShaperSkill | 출력을 복합 형식(전체 이름, 여러 줄로 이루어진 주소 또는 성과 개인 식별자의 조합에 사용될 수 있는 다중 파트 데이터 형식)에 매핑합니다. | 해당 없음 |
Microsoft.Skills.Text.SplitSkill | 콘텐츠를 증분 방식으로 보강하거나 보충할 수 있도록 텍스트를 페이지로 분할합니다. | 해당 없음 |
사용자 지정 기술
사용자 지정 기술은 사용자가 디자인하고 개발하여 웹에 배포하는 외부 코드를 래핑합니다. 그런 다음, 기술 세트 내에서 모듈을 사용자 지정 기술로 호출할 수 있습니다.
Type | 설명 | 요금제 기준 |
---|---|---|
Microsoft.Skills.Custom.WebApiSkill | 사용자 지정 웹 API에 대해 HTTP 호출을 수행하여 AI 보강 파이프라인의 확장성 허용 | 솔루션에서 요금제 Azure 서비스를 사용하지 않는 한 없음 |
Microsoft.Skills.Custom.AmlSkill | Azure Machine Learning 모델을 사용하여 AI 보강 파이프라인의 확장성 허용 | 솔루션에서 요금제 Azure 서비스를 사용하지 않는 한 없음 |
사용자 지정 기술 생성에 대한 지침은 사용자 지정 인터페이스 정의 및 예제: AI 보강의 사용자 지정 기술 만들기를 참조하세요.