다음을 통해 공유


Skillsets - Get

검색 서비스에서 기술 세트를 검색합니다.

GET {endpoint}/skillsets('{skillsetName}')?api-version=2024-11-01-preview

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
endpoint
path True

string

검색 서비스의 엔드포인트 URL입니다.

skillsetName
path True

string

검색할 기술 세트의 이름입니다.

api-version
query True

string

클라이언트 API 버전입니다.

요청 헤더

Name 필수 형식 Description
x-ms-client-request-id

string (uuid)

디버깅에 도움이 되도록 요청과 함께 전송된 추적 ID입니다.

응답

Name 형식 Description
200 OK

SearchIndexerSkillset

기술 세트가 성공적으로 반환됩니다.

Other Status Codes

ErrorResponse

오류 응답입니다.

예제

SearchServiceGetSkillset

샘플 요청

GET https://previewexampleservice.search.windows.net/skillsets('myskillset')?api-version=2024-11-01-preview

샘플 응답

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "myskillset",
  "description": "Skillset for extracting entities and more",
  "skills": [
    {
      "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
      "name": "skill2",
      "context": "/document",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "countryHint",
          "source": "/document/countryHint",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "languageCode",
          "targetName": "languageCode"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.SplitSkill",
      "name": "skill3",
      "context": "/document",
      "defaultLanguageCode": "en",
      "textSplitMode": "pages",
      "maximumPageLength": 4000,
      "pageOverlapLength": 0,
      "maximumPagesToTake": 0,
      "unit": "azureOpenAITokens",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "textItems",
          "targetName": "pages"
        }
      ],
      "azureOpenAITokenizerParameters": {
        "encoderModelName": "cl100k_base",
        "allowedSpecialTokens": [
          "[START]",
          "[END]"
        ]
      }
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
      "name": "skill4",
      "context": "/document/pages/*",
      "defaultLanguageCode": "en",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "keyPhrases",
          "targetName": "keyPhrases"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
      "name": "skill5",
      "context": "/document",
      "uri": "https://contoso.example.org/",
      "httpMethod": "POST",
      "timeout": "PT5S",
      "batchSize": 1000,
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "customresult",
          "targetName": "result"
        }
      ],
      "httpHeaders": {}
    },
    {
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany",
      "markdownHeaderDepth": "h3",
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "markdown_document",
          "targetName": "markdown_document"
        }
      ]
    }
  ],
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  }
}

정의

Name Description
AIServicesAccountIdentity

기술 세트에 연결된 Azure AI 서비스 리소스의 다중 지역 계정입니다.

AIServicesAccountKey

리소스의 하위 도메인과 함께 사용할 기술 세트에 연결된 Azure AI 서비스 리소스의 계정 키입니다.

AmlSkill

AML 기술을 사용하면 사용자 지정 AML(Azure Machine Learning) 모델을 사용하여 AI 보강을 확장할 수 있습니다. AML 모델을 학습하고 배포하면 AML 기술이 이를 AI 보강에 통합합니다.

AzureActiveDirectoryApplicationCredentials

Azure Key Vault에 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 생성된 등록된 애플리케이션의 자격 증명입니다.

AzureOpenAIEmbeddingSkill

Azure OpenAI 리소스를 사용하여 지정된 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다.

AzureOpenAIModelName

호출될 Azure Open AI 모델 이름입니다.

AzureOpenAITokenizerParameters
CognitiveServicesAccountKey

기술 세트에 연결된 Azure AI 서비스 리소스의 다중 지역 계정 키입니다.

ConditionalSkill

부울 작업이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있도록 하는 기술입니다.

CustomEntity

찾은 일치 항목 및 관련 메타데이터에 대한 정보가 들어 있는 개체입니다.

CustomEntityAlias

루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체입니다.

CustomEntityLookupSkill

기술은 사용자 정의 단어 및 구의 사용자 정의 목록에서 텍스트를 찾습니다.

CustomEntityLookupSkillLanguage

CustomEntityLookupSkill의 입력 텍스트에 지원되는 언어 코드입니다.

DefaultCognitiveServicesAccount

기술 세트의 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다.

DocumentExtractionSkill

보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다.

DocumentIntelligenceLayoutSkill

보강 파이프라인 내의 파일에서 Azure AI Services를 통해 콘텐츠 및 레이아웃 정보(markdown)를 추출하는 기술입니다.

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

markdown 출력의 헤더 깊이입니다. 기본값은 h6입니다.

DocumentIntelligenceLayoutSkillOutputMode

기술에 의해 생성된 출력의 카디널리티를 제어합니다. 기본값은 'oneToMany'입니다.

EntityCategory

반환할 엔터티 범주를 나타내는 문자열입니다.

EntityLinkingSkill

Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다.

EntityRecognitionSkill

이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 EntityRecognitionSkill입니다.

EntityRecognitionSkillLanguage

되지 않는. EntityRecognitionSkill의 입력 텍스트에 지원되는 언어 코드입니다.

EntityRecognitionSkillV3

Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다.

ErrorAdditionalInfo

리소스 관리 오류 추가 정보입니다.

ErrorDetail

오류 세부 정보입니다.

ErrorResponse

오류 응답

ImageAnalysisSkill

이미지 파일을 분석하는 기술입니다. 이미지 콘텐츠에 따라 다양한 시각적 기능 집합을 추출합니다.

ImageAnalysisSkillLanguage

ImageAnalysisSkill에서 입력할 수 있는 언어 코드입니다.

ImageDetail

반환할 도메인별 세부 정보를 나타내는 문자열입니다.

IndexProjectionMode

인덱서의 나머지 부분과 관련하여 인덱스 프로젝션의 동작을 정의합니다.

InputFieldMappingEntry

기술에 대한 입력 필드 매핑입니다.

KeyPhraseExtractionSkill

핵심 구 추출에 텍스트 분석을 사용하는 기술입니다.

KeyPhraseExtractionSkillLanguage

KeyPhraseExtractionSkill의 입력 텍스트에 지원되는 언어 코드입니다.

LanguageDetectionSkill

입력 텍스트의 언어를 감지하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 기술입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이깁니다.

LineEnding

OCR 기술에서 인식하는 텍스트 줄 사이에 사용할 문자 시퀀스를 정의합니다. 기본값은 "space"입니다.

MergeSkill

두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술로, 선택적 사용자 정의 구분 기호가 각 구성 요소 부분을 구분합니다.

OcrSkill

이미지 파일에서 텍스트를 추출하는 기술입니다.

OcrSkillLanguage

OcrSkill에서 입력할 수 있는 언어 코드입니다.

OutputFieldMappingEntry

기술에 대한 출력 필드 매핑입니다.

PIIDetectionSkill

Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다.

PIIDetectionSkillMaskingMode

입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다.

SearchIndexerDataNoneIdentity

데이터 원본의 ID 속성을 지웁니다.

SearchIndexerDataUserAssignedIdentity

사용할 데이터 원본의 ID를 지정합니다.

SearchIndexerIndexProjections

보조 검색 인덱스에 대한 추가 프로젝션 정의입니다.

SearchIndexerIndexProjectionSelector

지정된 검색 인덱스로 저장할 데이터에 대한 설명입니다.

SearchIndexerIndexProjectionsParameters

인덱스 프로젝션 관련 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.

SearchIndexerKnowledgeStore

보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다.

SearchIndexerKnowledgeStoreFileProjectionSelector

Azure Files에 저장할 데이터에 대한 프로젝션 정의입니다.

SearchIndexerKnowledgeStoreObjectProjectionSelector

Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다.

SearchIndexerKnowledgeStoreParameters

지식 저장소별 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.

SearchIndexerKnowledgeStoreProjection

다양한 프로젝션 선택기에 대한 컨테이너 개체입니다.

SearchIndexerKnowledgeStoreTableProjectionSelector

Azure 테이블에 저장할 데이터에 대한 설명입니다.

SearchIndexerSkillset

기술 목록입니다.

SearchResourceEncryptionKey

Azure Key Vault의 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 미사용 데이터를 암호화하거나 암호 해독할 수 있습니다.

SentimentSkill

이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 SentimentSkill.

SentimentSkillLanguage

되지 않는. SentimentSkill의 입력 텍스트에 지원되는 언어 코드입니다.

SentimentSkillV3

Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정", "중립" 및 "긍정")을 제공합니다.

ShaperSkill

출력을 재구성하기 위한 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다.

SplitSkill

문자열을 텍스트 청크로 분할하는 기술입니다.

SplitSkillEncoderModelName

단위가 azureOpenAITokens로 설정된 경우에만 적용됩니다. 옵션으로는 'R50k_base', 'P50k_base', 'P50k_edit' 및 'CL100k_base'이 있습니다. 기본값은 'CL100k_base'입니다.

SplitSkillLanguage

SplitSkill의 입력 텍스트에 지원되는 언어 코드입니다.

SplitSkillUnit

사용할 단위를 나타내는 값입니다.

TextSplitMode

수행할 분할 모드를 나타내는 값입니다.

TextTranslationSkill

텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다.

TextTranslationSkillLanguage

TextTranslationSkill의 입력 텍스트에 지원되는 언어 코드입니다.

VisionVectorizeSkill

Azure AI Services Vision Vectorize API를 사용하여 지정된 이미지 또는 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다.

VisualFeature

반환할 시각적 기능 유형을 나타내는 문자열입니다.

WebApiSkill

Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다.

AIServicesAccountIdentity

기술 세트에 연결된 Azure AI 서비스 리소스의 다중 지역 계정입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Azure.Search.AIServicesByIdentity

기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다.

description

string

기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다.

identity SearchIndexerDataIdentity:

AI 서비스에 대한 연결에 사용되는 사용자 할당 관리 ID입니다. 지정하지 않으면 시스템 할당 관리 ID가 사용됩니다. 기술 세트 업데이트 시 ID가 지정되지 않은 경우 값은 변경되지 않은 상태로 유지됩니다. "none"으로 설정하면 이 속성의 값이 지워집니다.

subdomainUrl

string

해당 AI 서비스의 하위 도메인 URL입니다.

AIServicesAccountKey

리소스의 하위 도메인과 함께 사용할 기술 세트에 연결된 Azure AI 서비스 리소스의 계정 키입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Azure.Search.AIServicesByKey

기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다.

description

string

기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다.

key

string

기술 세트에 연결된 Azure AI 서비스 리소스를 프로비전하는 데 사용되는 키입니다.

subdomainUrl

string

해당 AI 서비스의 하위 도메인 URL입니다.

AmlSkill

AML 기술을 사용하면 사용자 지정 AML(Azure Machine Learning) 모델을 사용하여 AI 보강을 확장할 수 있습니다. AML 모델을 학습하고 배포하면 AML 기술이 이를 AI 보강에 통합합니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Custom.AmlSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

degreeOfParallelism

integer (int32)

(선택 사항) 지정된 경우 인덱서가 제공한 엔드포인트와 병렬로 수행할 호출 수를 나타냅니다. 엔드포인트가 너무 높은 요청 로드에서 실패하는 경우 이 값을 줄이거나, 엔드포인트가 더 많은 요청을 수락할 수 있고 인덱서의 성능을 향상시키려면 이 값을 올릴 수 있습니다. 설정하지 않으면 기본값 5가 사용됩니다. degreeOfParallelism은 최대 10 및 최소 1로 설정할 수 있습니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

key

string

(키 인증에 필요) AML 서비스의 키입니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

region

string

(토큰 인증의 경우 선택 사항). AML 서비스가 배포된 지역입니다.

resourceId

string

(토큰 인증에 필요). AML 서비스의 Azure Resource Manager 리소스 ID입니다. 구독/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/services/{service_name}형식이어야 합니다.

timeout

string (duration)

(선택 사항) 지정된 경우 API를 호출하는 http 클라이언트에 대한 시간 제한을 나타냅니다.

uri

string (uri)

(인증 또는 키 인증을 사용하지 않는 데 필요) JSON 페이로드를 보낼 AML 서비스의 점수 매기기 URI입니다. https URI 스키마만 허용됩니다.

AzureActiveDirectoryApplicationCredentials

Azure Key Vault에 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 생성된 등록된 애플리케이션의 자격 증명입니다.

Name 형식 Description
applicationId

string

미사용 데이터를 암호화할 때 사용할 Azure Key Vault에 필요한 액세스 권한이 부여된 AAD 애플리케이션 ID입니다. 애플리케이션 ID는 AAD 애플리케이션의 개체 ID와 혼동해서는 안 됩니다.

applicationSecret

string

지정된 AAD 애플리케이션의 인증 키입니다.

AzureOpenAIEmbeddingSkill

Azure OpenAI 리소스를 사용하여 지정된 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill

기술 유형을 지정하는 URI 조각입니다.

apiKey

string

지정된 Azure OpenAI 리소스의 API 키입니다.

authIdentity SearchIndexerDataIdentity:

아웃바운드 연결에 사용되는 사용자 할당 관리 ID입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

deploymentId

string

지정된 리소스에 대한 Azure OpenAI 모델 배포의 ID입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

dimensions

integer (int32)

결과 출력 포함에 포함해야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

modelName

AzureOpenAIModelName

제공된 deploymentId 경로에 배포되는 포함 모델의 이름입니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

resourceUri

string (uri)

Azure OpenAI 리소스의 리소스 URI입니다.

AzureOpenAIModelName

호출될 Azure Open AI 모델 이름입니다.

Description
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

AzureOpenAITokenizerParameters

Name 형식 Description
allowedSpecialTokens

string[]

(선택 사항) 단위가 azureOpenAITokens로 설정된 경우에만 적용됩니다. 이 매개 변수는 토큰화 프로세스 내에서 허용되는 특수 토큰 컬렉션을 정의합니다.

encoderModelName

SplitSkillEncoderModelName

단위가 azureOpenAITokens로 설정된 경우에만 적용됩니다. 옵션으로는 'R50k_base', 'P50k_base', 'P50k_edit' 및 'CL100k_base'이 있습니다. 기본값은 'CL100k_base'입니다.

CognitiveServicesAccountKey

기술 세트에 연결된 Azure AI 서비스 리소스의 다중 지역 계정 키입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Azure.Search.CognitiveServicesByKey

기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다.

description

string

기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다.

key

string

기술 세트에 연결된 Azure AI 서비스 리소스를 프로비전하는 데 사용되는 키입니다.

ConditionalSkill

부울 작업이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있도록 하는 기술입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Util.ConditionalSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

CustomEntity

찾은 일치 항목 및 관련 메타데이터에 대한 정보가 들어 있는 개체입니다.

Name 형식 Description
accentSensitive

boolean

기본값은 false입니다. 엔터티 이름과의 비교가 악센트에 민감해야 하는지 여부를 나타내는 부울 값입니다.

aliases

CustomEntityAlias[]

루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체의 배열입니다.

caseSensitive

boolean

기본값은 false입니다. 엔터티 이름과의 비교가 문자 대/소문자를 구분해야 하는지 여부를 나타내는 부울 값입니다. "Microsoft"의 샘플 대/소문자를 구분하지 않는 일치 항목은 microsoft, microSoft, MICROSOFT일 수 있습니다.

defaultAccentSensitive

boolean

이 엔터티의 기본 악센트 구분 값을 변경합니다. 모든 별칭 accentSensitive 값의 기본값을 변경하는 데 사용됩니다.

defaultCaseSensitive

boolean

이 엔터티의 기본 대/소문자 구분 값을 변경합니다. 모든 별칭 caseSensitive 값의 기본값을 변경하는 데 사용됩니다.

defaultFuzzyEditDistance

integer (int32)

이 엔터티의 기본 유사 항목 편집 거리 값을 변경합니다. 모든 별칭 fuzzyEditDistance 값의 기본값을 변경하는 데 사용할 수 있습니다.

description

string

이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다.

fuzzyEditDistance

integer (int32)

기본값은 0입니다. 최대값은 5입니다. 엔터티 이름과 일치를 구성하는 허용되는 분기 문자 수를 나타냅니다. 지정된 일치 항목에 대해 가능한 가장 작은 유사 항목이 반환됩니다. 예를 들어 편집 거리가 3으로 설정된 경우 "Windows10"은 여전히 "Windows", "Windows10" 및 "Windows 7"과 일치합니다. 대/소문자 구분을 false로 설정하면 대/소문자 차이는 유사 허용 오차에 포함되지 않지만 그렇지 않습니다.

id

string

이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다.

name

string

최상위 엔터티 설명자입니다. 기술 출력의 일치 항목은 이 이름으로 그룹화되며 찾은 텍스트의 "정규화된" 형식을 나타내야 합니다.

subtype

string

이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다.

type

string

이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다.

CustomEntityAlias

루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체입니다.

Name 형식 Description
accentSensitive

boolean

별칭이 악센트를 구분하는지 확인합니다.

caseSensitive

boolean

별칭이 대/소문자를 구분하는지 확인합니다.

fuzzyEditDistance

integer (int32)

별칭의 유사 항목 편집 거리를 결정합니다.

text

string

별칭의 텍스트입니다.

CustomEntityLookupSkill

기술은 사용자 정의 단어 및 구의 사용자 정의 목록에서 텍스트를 찾습니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.CustomEntityLookupSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

CustomEntityLookupSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

entitiesDefinitionUri

string

일치시킬 모든 대상 텍스트가 포함된 JSON 또는 CSV 파일의 경로입니다. 이 엔터티 정의는 인덱서 실행의 시작 부분에서 읽습니다. 인덱서 실행 중에 이 파일에 대한 업데이트는 후속 실행까지 적용되지 않습니다. 이 구성은 HTTPS를 통해 액세스할 수 있어야 합니다.

globalDefaultAccentSensitive

boolean

AccentSensitive의 전역 플래그입니다. CustomEntity에서 AccentSensitive가 설정되지 않은 경우 이 값이 기본값이 됩니다.

globalDefaultCaseSensitive

boolean

CaseSensitive의 전역 플래그입니다. CustomEntity에서 CaseSensitive가 설정되지 않은 경우 이 값이 기본값이 됩니다.

globalDefaultFuzzyEditDistance

integer (int32)

FuzzyEditDistance의 전역 플래그입니다. CustomEntity에서 FuzzyEditDistance가 설정되지 않은 경우 이 값이 기본값이 됩니다.

inlineEntitiesDefinition

CustomEntity[]

인라인 CustomEntity 정의입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

CustomEntityLookupSkillLanguage

CustomEntityLookupSkill의 입력 텍스트에 지원되는 언어 코드입니다.

Description
da

덴마크어

de

독일어

en

영어

es

스페인어

fi

핀란드어

fr

프랑스어

it

이탈리아어

ko

한국어

pt

포르투갈어

DefaultCognitiveServicesAccount

기술 세트의 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Azure.Search.DefaultCognitiveServices

기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다.

description

string

기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다.

DocumentExtractionSkill

보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Util.DocumentExtractionSkill

기술 유형을 지정하는 URI 조각입니다.

configuration

object

기술에 대한 구성 사전입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

dataToExtract

string

기술에 대해 추출할 데이터의 형식입니다. 정의되지 않은 경우 'contentAndMetadata'로 설정됩니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

parsingMode

string

기술에 대한 parsingMode입니다. 정의되지 않은 경우 '기본값'으로 설정됩니다.

DocumentIntelligenceLayoutSkill

보강 파이프라인 내의 파일에서 Azure AI Services를 통해 콘텐츠 및 레이아웃 정보(markdown)를 추출하는 기술입니다.

Name 형식 Default value Description
@odata.type string:

#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

markdownHeaderDepth

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

h6

markdown 출력의 헤더 깊이입니다. 기본값은 h6입니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputMode

DocumentIntelligenceLayoutSkillOutputMode

oneToMany

기술에 의해 생성된 출력의 카디널리티를 제어합니다. 기본값은 'oneToMany'입니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

markdown 출력의 헤더 깊이입니다. 기본값은 h6입니다.

Description
h1

헤더 수준 1.

h2

헤더 수준 2.

h3

헤더 수준 3.

h4

헤더 수준 4.

h5

헤더 수준 5.

h6

헤더 수준 6.

DocumentIntelligenceLayoutSkillOutputMode

기술에 의해 생성된 출력의 카디널리티를 제어합니다. 기본값은 'oneToMany'입니다.

Description
oneToMany

구문 분석할 가장 깊은 markdown 헤더 섹션을 지정합니다.

EntityCategory

반환할 엔터티 범주를 나타내는 문자열입니다.

Description
datetime

날짜 및 시간을 설명하는 엔터티입니다.

email

전자 메일 주소를 설명하는 엔터티입니다.

location

물리적 위치를 설명하는 엔터티입니다.

organization

조직을 설명하는 엔터티입니다.

person

사람을 설명하는 엔터티입니다.

quantity

수량을 설명하는 엔터티입니다.

url

URL을 설명하는 엔터티입니다.

EntityLinkingSkill

Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.V3.EntityLinkingSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

string

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

minimumPrecision

number (double)

minimum: 0
maximum: 1

신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다.

modelVersion

string

Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

EntityRecognitionSkill

이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 EntityRecognitionSkill입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.EntityRecognitionSkill

기술 유형을 지정하는 URI 조각입니다.

categories

EntityCategory[]

추출해야 하는 엔터티 범주 목록입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

EntityRecognitionSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

includeTypelessEntities

boolean

잘 알려져 있지만 미리 정의된 형식을 준수하지 않는 엔터티를 포함할지 여부를 결정합니다. 이 구성이 설정되지 않은 경우(기본값), null로 설정하거나 false로 설정하면 미리 정의된 형식 중 하나를 준수하지 않는 엔터티가 표시되지 않습니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

minimumPrecision

number (double)

신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

EntityRecognitionSkillLanguage

되지 않는. EntityRecognitionSkill의 입력 텍스트에 지원되는 언어 코드입니다.

Description
ar

아랍어

cs

체코어

da

덴마크어

de

독일어

el

그리스어

en

영어

es

스페인어

fi

핀란드어

fr

프랑스어

hu

헝가리어

it

이탈리아어

ja

일본어

ko

한국어

nl

네덜란드어

no

노르웨이어(복말)

pl

폴란드어

pt-BR

포르투갈어(브라질)

pt-PT

포르투갈어(포르투갈)

ru

러시아어

sv

스웨덴어

tr

터키어

zh-Hans

Chinese-Simplified

zh-Hant

Chinese-Traditional

EntityRecognitionSkillV3

Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.V3.EntityRecognitionSkill

기술 유형을 지정하는 URI 조각입니다.

categories

string[]

추출해야 하는 엔터티 범주 목록입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

string

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

minimumPrecision

number (double)

minimum: 0
maximum: 1

신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다.

modelVersion

string

Text Analytics API를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

ErrorAdditionalInfo

리소스 관리 오류 추가 정보입니다.

Name 형식 Description
info

object

추가 정보입니다.

type

string

추가 정보 유형입니다.

ErrorDetail

오류 세부 정보입니다.

Name 형식 Description
additionalInfo

ErrorAdditionalInfo[]

오류 추가 정보입니다.

code

string

오류 코드입니다.

details

ErrorDetail[]

오류 세부 정보입니다.

message

string

오류 메시지입니다.

target

string

오류 대상입니다.

ErrorResponse

오류 응답

Name 형식 Description
error

ErrorDetail

오류 개체입니다.

ImageAnalysisSkill

이미지 파일을 분석하는 기술입니다. 이미지 콘텐츠에 따라 다양한 시각적 기능 집합을 추출합니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Vision.ImageAnalysisSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

ImageAnalysisSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

details

ImageDetail[]

반환할 도메인별 세부 정보를 나타내는 문자열입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

visualFeatures

VisualFeature[]

시각적 기능 목록입니다.

ImageAnalysisSkillLanguage

ImageAnalysisSkill에서 입력할 수 있는 언어 코드입니다.

Description
ar

아랍어

az

아제르바이잔어

bg

불가리어

bs

보스니아어(라틴 문자)

ca

카탈로니아어

cs

체코어

cy

웨일스어

da

덴마크어

de

독일어

el

그리스어

en

영어

es

스페인어

et

에스토니아어

eu

바스크어

fi

핀란드어

fr

프랑스어

ga

아일랜드어

gl

갈리시아어

he

히브리어

hi

힌디어

hr

크로아티아어

hu

헝가리어

id

인도네시아어

it

이탈리아어

ja

일본어

kk

카자흐어

ko

한국어

lt

리투아니아어

lv

라트비아어

mk

마케도니아인

ms

말레이시아

nb

노르웨이어(복말)

nl

네덜란드어

pl

폴란드어

prs

다리어

pt

Portuguese-Portugal

pt-BR

Portuguese-Brazil

pt-PT

Portuguese-Portugal

ro

루마니아어

ru

러시아어

sk

슬로바키아어

sl

슬로베니아어

sr-Cyrl

세르비아어 - 키릴 자모 RS

sr-Latn

세르비아어 - 라틴 RS

sv

스웨덴어

th

태국어

tr

터키어

uk

우크라이나어

vi

베트남어

zh

중국어 간체

zh-Hans

중국어 간체

zh-Hant

중국어 번체

ImageDetail

반환할 도메인별 세부 정보를 나타내는 문자열입니다.

Description
celebrities

유명인으로 인식되는 세부 정보입니다.

landmarks

랜드마크로 인식되는 세부 정보입니다.

IndexProjectionMode

인덱서의 나머지 부분과 관련하여 인덱스 프로젝션의 동작을 정의합니다.

Description
includeIndexingParentDocuments

원본 문서는 인덱서의 대상 인덱스로 작성됩니다. 이것이 기본 패턴입니다.

skipIndexingParentDocuments

원본 문서는 인덱서의 대상 인덱스로 작성하지 않습니다.

InputFieldMappingEntry

기술에 대한 입력 필드 매핑입니다.

Name 형식 Description
inputs

InputFieldMappingEntry[]

복합 형식을 만들 때 사용되는 재귀 입력입니다.

name

string

입력의 이름입니다.

source

string

입력의 소스입니다.

sourceContext

string

재귀 입력을 선택하는 데 사용되는 원본 컨텍스트입니다.

KeyPhraseExtractionSkill

핵심 구 추출에 텍스트 분석을 사용하는 기술입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.KeyPhraseExtractionSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

KeyPhraseExtractionSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

maxKeyPhraseCount

integer (int32)

반환할 핵심 구 수를 나타내는 숫자입니다. 없는 경우 식별된 모든 핵심 구가 반환됩니다.

modelVersion

string

Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

KeyPhraseExtractionSkillLanguage

KeyPhraseExtractionSkill의 입력 텍스트에 지원되는 언어 코드입니다.

Description
da

덴마크어

de

독일어

en

영어

es

스페인어

fi

핀란드어

fr

프랑스어

it

이탈리아어

ja

일본어

ko

한국어

nl

네덜란드어

no

노르웨이어(복말)

pl

폴란드어

pt-BR

포르투갈어(브라질)

pt-PT

포르투갈어(포르투갈)

ru

러시아어

sv

스웨덴어

LanguageDetectionSkill

입력 텍스트의 언어를 감지하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 기술입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이깁니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.LanguageDetectionSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultCountryHint

string

언어를 구분할 수 없는 경우 언어 감지 모델에 대한 힌트로 사용할 국가 코드입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

modelVersion

string

Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

LineEnding

OCR 기술에서 인식하는 텍스트 줄 사이에 사용할 문자 시퀀스를 정의합니다. 기본값은 "space"입니다.

Description
carriageReturn

줄은 캐리지 리턴('\r') 문자로 구분됩니다.

carriageReturnLineFeed

줄은 캐리지 리턴과 줄 바꿈('\r\n') 문자로 구분됩니다.

lineFeed

줄은 단일 줄 바꿈('\n') 문자로 구분됩니다.

space

선은 단일 공백 문자로 구분됩니다.

MergeSkill

두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술로, 선택적 사용자 정의 구분 기호가 각 구성 요소 부분을 구분합니다.

Name 형식 Default value Description
@odata.type string:

#Microsoft.Skills.Text.MergeSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

insertPostTag

string

태그는 병합된 텍스트의 끝을 나타냅니다. 기본적으로 태그는 빈 공간입니다.

insertPreTag

string

태그는 병합된 텍스트의 시작을 나타냅니다. 기본적으로 태그는 빈 공간입니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

OcrSkill

이미지 파일에서 텍스트를 추출하는 기술입니다.

Name 형식 Default value Description
@odata.type string:

#Microsoft.Skills.Vision.OcrSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

OcrSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

detectOrientation

boolean

False

방향 검색을 켜거나 설정하지 않음을 나타내는 값입니다. 기본값은 false입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

lineEnding

LineEnding

OCR 기술에서 인식하는 텍스트 줄 사이에 사용할 문자 시퀀스를 정의합니다. 기본값은 "space"입니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

OcrSkillLanguage

OcrSkill에서 입력할 수 있는 언어 코드입니다.

Description
Jns

Jaunsari(데바나기리)

af

아프리칸스어

anp

앙기카어(데바나기리)

ar

아랍어

ast

아스투리안 주

awa

Awadhi-Hindi(데바나기리)

az

아제르바이잔어(라틴 문자)

be

벨라루스어(키릴 자모 및 라틴 문자)

be-cyrl

벨라루스어(키릴 자모)

be-latn

벨라루스어(라틴 문자)

bfy

바겔리 주

bfz

마하수 파하리 (데바나기리)

bg

불가리어

bgc

하리얀비 주

bho

Bhojpuri-Hindi(데바나기리)

bi

비슬라마 주

bns

Bundeli

br

브루타뉴어

bra

브라이바 주

brx

보도(데바나기리)

bs

보스니아어(라틴 문자)

bua

부랴트(키릴 자모)

ca

카탈로니아어

ceb

세부아노 주

ch

차모로

cnr-cyrl

몬테네그로어(키릴 자모)

cnr-latn

몬테네그로어(라틴 문자)

co

코르시카어

crh

크림 타타르어(라틴 문자)

cs

체코어

csb

Kashubian

cy

웨일스어

da

덴마크어

de

독일어

dhi

디말(데바나기리)

doi

도그리어(데바나기리)

dsb

로어 소르비안

el

그리스어

en

영어

es

스페인어

et

에스토니아어

eu

바스크어

fa

페르시아어

fi

핀란드어

fil

필리핀어

fj

피지어

fo

페로어

fr

프랑스어

fur

프룰리안 주

fy

서부 프리시안

ga

아일랜드어

gag

가가우즈어(라틴 문자)

gd

스코틀랜드 게일어

gil

길베르테스 주

gl

갈리시아어

gon

곤디(데바나기리)

gv

Manx

gvr

구룽어(데바나기리)

haw

하와이어

hi

힌디어

hlb

할비 (데바나기리)

hne

차티스가리 (데바나기리)

hni

하니 주

hoc

호 (데바나기리)

hr

크로아티아어

hsb

어퍼 소르비안

ht

아이티어

hu

헝가리어

ia

인테르링구아

id

인도네시아어

is

아이슬란드어

it

이탈리아어

iu

이누크티투트어(라틴 문자)

ja

일본어

jv

Javanese

kaa

Kara-Kalpak(라틴 문자)

kaa-cyrl

Kara-Kalpak(키릴 자모)

kac

카친어(라틴 문자)

kea

Kabuverdianu

kfq

Korku

kha

Khasi

kk-cyrl

카자흐어(키릴 자모)

kk-latn

카자흐어(라틴 문자)

kl

그린란드어

klr

칼링 (주)

kmj

말토어(데바나기리)

ko

한국어

kos

Kosraean

kpy

코리아크 주

krc

Karachay-Balkar

kru

쿠루크어(데바나기리)

ksh

리푸아리안 주

ku-arab

쿠르드어(아랍어)

ku-latn

쿠르드어(라틴 문자)

kum

Kumyk(키릴 자모)

kw

콘월어

ky

키르기스어(키릴 자모)

la

라틴어

lb

룩셈부르크어

lkt

라코타 주

lt

리투아니아어

mi

마오리어

mn

몽골어(키릴 자모)

mr

마라티어

ms

말레이어(라틴 문자)

mt

몰타어

mww

흐몽 도우(라틴 문자)

myv

에르자(키릴 자모)

nap

나폴리의

nb

노르웨이어

ne

네팔어

niu

니우에안 주

nl

네덜란드어

no

노르웨이어

nog

노게이 ()

oc

오크어

os

Ossetic

pa

펀잡어(아랍어)

pl

폴란드어

prs

다리어

ps

파슈토어

pt

포르투갈어

quc

K'iche'

rab

Chamling

rm

로만시 주

ro

루마니아어

ru

러시아어

sa

산스크리트어(데바나기리)

sat

산타리 (데바나기리)

sck

사드리 (데바나기리)

sco

스코트어

sk

슬로바키아어

sl

슬로베니아어

sm

사모아어(라틴 문자)

sma

서던 사미

sme

북부 사미어(라틴 문자)

smj

룰레 사미

smn

사미 나리

sms

Skolt Sami

so

소말리어(아랍어)

sq

알바니아어

sr

세르비아어(라틴 문자)

sr-Cyrl

세르비아어(키릴 자모)

sr-Latn

세르비아어(라틴 문자)

srx

시르마우리 (데바나기리)

sv

스웨덴어

sw

스와힐리어(라틴 문자)

tet

Tetum

tg

타지크어(키릴 자모)

thf

탄미 시

tk

투르크멘어(라틴 문자)

to

통가

tr

터키어

tt

타타르어(라틴 문자)

tyv

투반 (주)

ug

위구르어(아랍어)

unk

알 수 없음(모두)

ur

우르두어

uz

우즈베키스탄어(라틴 문자)

uz-arab

우즈베키스탄어(아랍어)

uz-cyrl

우즈베크어(키릴 자모)

vo

Volapük

wae

Walser

xnr

Kangri(Devanagiri)

xsr

셰르파 (데바나기리)

yua

유카텍 마야

za

주앙 시

zh-Hans

중국어 간체

zh-Hant

중국어 번체

zu

줄루어

OutputFieldMappingEntry

기술에 대한 출력 필드 매핑입니다.

Name 형식 Description
name

string

기술에서 정의한 출력의 이름입니다.

targetName

string

출력의 대상 이름입니다. 선택 사항이며 기본적으로 이름을 지정합니다.

PIIDetectionSkill

Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.PIIDetectionSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

string

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

domain

string

지정된 경우 엔터티 범주의 하위 집합만 포함하도록 PII 도메인을 설정합니다. 가능한 값은 'phi', 'none'입니다. 기본값은 'none'입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

maskingCharacter

string

maxLength: 1

maskingMode 매개 변수가 대체되도록 설정된 경우 텍스트를 마스킹하는 데 사용되는 문자입니다. 기본값은 '*'입니다.

maskingMode

PIIDetectionSkillMaskingMode

입력 텍스트에서 검색된 개인 정보를 마스킹하는 다양한 방법을 제공하는 매개 변수입니다. 기본값은 'none'입니다.

minimumPrecision

number (double)

minimum: 0
maximum: 1

신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다.

modelVersion

string

Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

piiCategories

string[]

추출하고 마스킹해야 하는 PII 엔터티 범주 목록입니다.

PIIDetectionSkillMaskingMode

입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다.

Description
none

마스킹이 발생하지 않으며 maskedText 출력이 반환되지 않습니다.

replace

검색된 엔터티를 maskingCharacter 매개 변수에 지정된 문자로 바꿉니다. 이 문자는 검색된 엔터티의 길이로 반복되므로 오프셋이 입력 텍스트와 출력 maskedText 모두에 올바르게 해당합니다.

SearchIndexerDataNoneIdentity

데이터 원본의 ID 속성을 지웁니다.

Name 형식 Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

ID 유형을 지정하는 URI 조각입니다.

SearchIndexerDataUserAssignedIdentity

사용할 데이터 원본의 ID를 지정합니다.

Name 형식 Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

ID 유형을 지정하는 URI 조각입니다.

userAssignedIdentity

string

일반적으로 검색 서비스에 할당되어야 하는 "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" 형식으로 사용자 할당 관리 ID의 정규화된 Azure 리소스 ID입니다.

SearchIndexerIndexProjections

보조 검색 인덱스에 대한 추가 프로젝션 정의입니다.

Name 형식 Description
parameters

SearchIndexerIndexProjectionsParameters

인덱스 프로젝션 관련 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.

selectors

SearchIndexerIndexProjectionSelector[]

보조 검색 인덱스에 수행할 프로젝션 목록입니다.

SearchIndexerIndexProjectionSelector

지정된 검색 인덱스로 저장할 데이터에 대한 설명입니다.

Name 형식 Description
mappings

InputFieldMappingEntry[]

프로젝션에 대한 매핑 또는 대상 인덱스의 필드에 매핑해야 하는 원본입니다.

parentKeyFieldName

string

상위 문서의 키 값을 매핑할 검색 인덱스의 필드 이름입니다. 키 필드가 아닌 필터링 가능한 문자열 필드여야 합니다.

sourceContext

string

프로젝션의 원본 컨텍스트입니다. 문서가 여러 하위 문서로 분할되는 카디널리티를 나타냅니다.

targetIndexName

string

프로젝트할 검색 인덱스의 이름입니다. '키워드' 분석기 집합이 있는 키 필드가 있어야 합니다.

SearchIndexerIndexProjectionsParameters

인덱스 프로젝션 관련 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.

Name 형식 Description
projectionMode

IndexProjectionMode

인덱서의 나머지 부분과 관련하여 인덱스 프로젝션의 동작을 정의합니다.

SearchIndexerKnowledgeStore

보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다.

Name 형식 Description
identity SearchIndexerDataIdentity:

지식 저장소 프로젝션을 작성할 때 Azure Storage에 대한 연결에 사용되는 사용자 할당 관리 ID입니다. 연결 문자열이 ID(ResourceId)를 나타내고 지정되지 않은 경우 시스템 할당 관리 ID가 사용됩니다. 인덱서 업데이트 시 ID가 지정되지 않은 경우 값은 변경되지 않은 상태로 유지됩니다. "none"으로 설정하면 이 속성의 값이 지워집니다.

parameters

SearchIndexerKnowledgeStoreParameters

지식 저장소별 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.

projections

SearchIndexerKnowledgeStoreProjection[]

인덱싱 중에 수행할 추가 프로젝션 목록입니다.

storageConnectionString

string

스토리지 계정 프로젝션에 대한 연결 문자열이 저장됩니다.

SearchIndexerKnowledgeStoreFileProjectionSelector

Azure Files에 저장할 데이터에 대한 프로젝션 정의입니다.

Name 형식 Description
generatedKeyName

string

프로젝션을 저장할 생성된 키의 이름입니다.

inputs

InputFieldMappingEntry[]

복잡한 프로젝션에 대한 중첩된 입력입니다.

referenceKeyName

string

다른 프로젝션에 대한 참조 키의 이름입니다.

source

string

프로젝트에 데이터를 원본으로 지정합니다.

sourceContext

string

복잡한 프로젝션에 대한 원본 컨텍스트입니다.

storageContainer

string

프로젝션을 저장할 Blob 컨테이너입니다.

SearchIndexerKnowledgeStoreObjectProjectionSelector

Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다.

Name 형식 Description
generatedKeyName

string

프로젝션을 저장할 생성된 키의 이름입니다.

inputs

InputFieldMappingEntry[]

복잡한 프로젝션에 대한 중첩된 입력입니다.

referenceKeyName

string

다른 프로젝션에 대한 참조 키의 이름입니다.

source

string

프로젝트에 데이터를 원본으로 지정합니다.

sourceContext

string

복잡한 프로젝션에 대한 원본 컨텍스트입니다.

storageContainer

string

프로젝션을 저장할 Blob 컨테이너입니다.

SearchIndexerKnowledgeStoreParameters

지식 저장소별 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.

Name 형식 Default value Description
synthesizeGeneratedKeyName

boolean

False

프로젝션이 아직 없는 경우 생성된 키 이름을 합성해야 하는지 여부입니다.

SearchIndexerKnowledgeStoreProjection

다양한 프로젝션 선택기에 대한 컨테이너 개체입니다.

Name 형식 Description
files

SearchIndexerKnowledgeStoreFileProjectionSelector[]

Azure File Storage에 대한 프로젝션.

objects

SearchIndexerKnowledgeStoreObjectProjectionSelector[]

Azure Blob Storage에 대한 프로젝션.

tables

SearchIndexerKnowledgeStoreTableProjectionSelector[]

Azure Table Storage에 대한 프로젝션.

SearchIndexerKnowledgeStoreTableProjectionSelector

Azure 테이블에 저장할 데이터에 대한 설명입니다.

Name 형식 Description
generatedKeyName

string

프로젝션을 저장할 생성된 키의 이름입니다.

inputs

InputFieldMappingEntry[]

복잡한 프로젝션에 대한 중첩된 입력입니다.

referenceKeyName

string

다른 프로젝션에 대한 참조 키의 이름입니다.

source

string

프로젝트에 데이터를 원본으로 지정합니다.

sourceContext

string

복잡한 프로젝션에 대한 원본 컨텍스트입니다.

tableName

string

프로젝터된 데이터를 저장할 Azure 테이블의 이름입니다.

SearchIndexerSkillset

기술 목록입니다.

Name 형식 Description
@odata.etag

string

기술 세트의 ETag입니다.

cognitiveServices CognitiveServicesAccount:

기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다.

description

string

기술 세트에 대한 설명입니다.

encryptionKey

SearchResourceEncryptionKey

Azure Key Vault에서 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft를 비롯한 누구도 기술 세트 정의를 해독할 수 없다는 완전한 보증을 원할 때 기술 세트 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화한 후에는 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 회전하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용한 암호화는 무료 검색 서비스에 사용할 수 없으며 2019년 1월 1일 이후 생성된 유료 서비스에만 사용할 수 있습니다.

indexProjections

SearchIndexerIndexProjections

보조 검색 인덱스에 대한 추가 프로젝션 정의입니다.

knowledgeStore

SearchIndexerKnowledgeStore

보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다.

name

string

기술 세트의 이름입니다.

skills SearchIndexerSkill[]:

기술 세트의 기술 목록입니다.

SearchResourceEncryptionKey

Azure Key Vault의 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 미사용 데이터를 암호화하거나 암호 해독할 수 있습니다.

Name 형식 Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Azure Key Vault에 액세스하는 데 사용되는 선택적 Azure Active Directory 자격 증명입니다. 대신 관리 ID를 사용하는 경우에는 필요하지 않습니다.

identity SearchIndexerDataIdentity:

이 암호화 키에 사용할 명시적 관리 ID입니다. 지정하지 않고 액세스 자격 증명 속성이 null이면 시스템 할당 관리 ID가 사용됩니다. 리소스 업데이트 시 명시적 ID가 지정되지 않은 경우 변경되지 않은 상태로 유지됩니다. "none"을 지정하면 이 속성의 값이 지워집니다.

keyVaultKeyName

string

미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 이름입니다.

keyVaultKeyVersion

string

미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 버전입니다.

keyVaultUri

string

미사용 데이터를 암호화하는 데 사용할 키를 포함하는 DNS 이름이라고도 하는 Azure Key Vault의 URI입니다. 예제 URI는 https://my-keyvault-name.vault.azure.net수 있습니다.

SentimentSkill

이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 SentimentSkill.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.SentimentSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

SentimentSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

SentimentSkillLanguage

되지 않는. SentimentSkill의 입력 텍스트에 지원되는 언어 코드입니다.

Description
da

덴마크어

de

독일어

el

그리스어

en

영어

es

스페인어

fi

핀란드어

fr

프랑스어

it

이탈리아어

nl

네덜란드어

no

노르웨이어(복말)

pl

폴란드어

pt-PT

포르투갈어(포르투갈)

ru

러시아어

sv

스웨덴어

tr

터키어

SentimentSkillV3

Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정", "중립" 및 "긍정")을 제공합니다.

Name 형식 Default value Description
@odata.type string:

#Microsoft.Skills.Text.V3.SentimentSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

string

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

includeOpinionMining

boolean

False

true로 설정하면 기술 출력에는 오피니언 마이닝에 대한 Text Analytics의 정보, 즉 대상(명사 또는 동사) 및 해당 관련 평가(형용사)가 텍스트에 포함됩니다. 기본값은 false입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

modelVersion

string

Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

ShaperSkill

출력을 재구성하기 위한 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Util.ShaperSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

SplitSkill

문자열을 텍스트 청크로 분할하는 기술입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.SplitSkill

기술 유형을 지정하는 URI 조각입니다.

azureOpenAITokenizerParameters

AzureOpenAITokenizerParameters

단위가 azureOpenAITokens로 설정된 경우에만 적용됩니다. 지정한 경우 splitSkill은 토큰화를 수행할 때 이러한 매개 변수를 사용합니다. 매개 변수는 유효한 'encoderModelName' 및 선택적 'allowedSpecialTokens' 속성입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultLanguageCode

SplitSkillLanguage

사용할 언어 코드를 나타내는 값입니다. 기본값은 en.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

maximumPageLength

integer (int32)

원하는 최대 페이지 길이입니다. 기본값은 10000입니다.

maximumPagesToTake

integer (int32)

textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정한 경우 SplitSkill은 각 문서에서 몇 개의 초기 페이지만 필요한 경우 성능을 향상시키기 위해 첫 번째 'maximumPagesToTake' 페이지를 처리한 후 분할을 중단합니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

pageOverlapLength

integer (int32)

textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 n+1번째 청크는 n번째 청크의 끝에서 이 수의 문자/토큰으로 시작됩니다.

textSplitMode

TextSplitMode

수행할 분할 모드를 나타내는 값입니다.

unit

SplitSkillUnit

textSplitMode가 페이지로 설정된 경우에만 적용됩니다. 두 가지 가능한 값이 있습니다. 값을 선택하면 길이(maximumPageLength 및 pageOverlapLength) 측정값이 결정됩니다. 기본값은 'characters'입니다. 즉, 길이가 문자로 측정됩니다.

SplitSkillEncoderModelName

단위가 azureOpenAITokens로 설정된 경우에만 적용됩니다. 옵션으로는 'R50k_base', 'P50k_base', 'P50k_edit' 및 'CL100k_base'이 있습니다. 기본값은 'CL100k_base'입니다.

Description
cl100k_base

토큰 어휘가 100,000개인 기본 모델입니다.

p50k_base

프롬프트 기반 작업에 최적화된 50,000개의 토큰 어휘가 있는 기본 모델입니다.

p50k_edit

p50k_base 비슷하지만 50,000개의 토큰 어휘를 사용하여 작업을 편집하거나 다시 표현하기 위해 미세 조정되었습니다.

r50k_base

일반적인 자연어 처리 작업에 자주 사용되는 50,000개의 토큰 어휘로 학습된 기본 모델을 나타냅니다.

SplitSkillLanguage

SplitSkill의 입력 텍스트에 지원되는 언어 코드입니다.

Description
am

암하라어

bs

보스니아어

cs

체코어

da

덴마크어

de

독일어

en

영어

es

스페인어

et

에스토니아어

fi

핀란드어

fr

프랑스어

he

히브리어

hi

힌디어

hr

크로아티아어

hu

헝가리어

id

인도네시아어

is

아이슬란드어

it

이탈리아어

ja

일본어

ko

한국어

lv

라트비아어

nb

노르웨이어

nl

네덜란드어

pl

폴란드어

pt

포르투갈어(포르투갈)

pt-br

포르투갈어(브라질)

ru

러시아어

sk

슬로바키아어

sl

슬로베니아어

sr

세르비아어

sv

스웨덴어

tr

터키어

ur

우르두어

zh

중국어(간체)

SplitSkillUnit

사용할 단위를 나타내는 값입니다.

Description
azureOpenAITokens

길이는 tiktoken 라이브러리의 AzureOpenAI 토큰 변환기를 통해 측정됩니다.

characters

길이는 문자로 측정됩니다.

TextSplitMode

수행할 분할 모드를 나타내는 값입니다.

Description
pages

텍스트를 개별 페이지로 분할합니다.

sentences

텍스트를 개별 문장으로 분할합니다.

TextTranslationSkill

텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Text.TranslationSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

defaultFromLanguageCode

TextTranslationSkillLanguage

원본 언어를 명시적으로 지정하지 않는 문서의 문서를 번역할 언어 코드입니다.

defaultToLanguageCode

TextTranslationSkillLanguage

to 언어를 명시적으로 지정하지 않는 문서에 대해 문서를 번역할 언어 코드입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

suggestedFrom

TextTranslationSkillLanguage

fromLanguageCode 입력이나 defaultFromLanguageCode 매개 변수가 제공되지 않고 자동 언어 검색에 실패한 경우 문서를 번역할 언어 코드입니다. 기본값은 en.

TextTranslationSkillLanguage

TextTranslationSkill의 입력 텍스트에 지원되는 언어 코드입니다.

Description
af

아프리칸스어

ar

아랍어

bg

불가리어

bn

벵골어

bs

보스니아어(라틴 문자)

ca

카탈로니아어

cs

체코어

cy

웨일스어

da

덴마크어

de

독일어

el

그리스어

en

영어

es

스페인어

et

에스토니아어

fa

페르시아어

fi

핀란드어

fil

필리핀어

fj

피지어

fr

프랑스어

ga

아일랜드어

he

히브리어

hi

힌디어

hr

크로아티아어

ht

아이티어

hu

헝가리어

id

인도네시아어

is

아이슬란드어

it

이탈리아어

ja

일본어

kn

칸나다어

ko

한국어

lt

리투아니아어

lv

라트비아어

mg

마다가스카르

mi

마오리어

ml

말라얄람어

ms

말레이어

mt

몰타어

mww

흐몽 도우

nb

노르웨이어

nl

네덜란드어

otq

오토미 케레타로

pa

펀잡어

pl

폴란드어

pt

포르투갈어

pt-PT

포르투갈어(포르투갈)

pt-br

포르투갈어(브라질)

ro

루마니아어

ru

러시아어

sk

슬로바키아어

sl

슬로베니아어

sm

사모아

sr-Cyrl

세르비아어(키릴 자모)

sr-Latn

세르비아어(라틴 문자)

sv

스웨덴어

sw

키스와힐리

ta

타밀어

te

텔루구어

th

태국어

tlh

클링온 (주)

tlh-Latn

클링온(라틴어 스크립트)

tlh-Piqd

클링온(클링온 스크립트)

to

통가

tr

터키어

ty

타히티어

uk

우크라이나어

ur

우르두어

vi

베트남어

yua

유카텍 마야

yue

광둥어(번체)

zh-Hans

중국어 간체

zh-Hant

중국어 번체

VisionVectorizeSkill

Azure AI Services Vision Vectorize API를 사용하여 지정된 이미지 또는 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Vision.VectorizeSkill

기술 유형을 지정하는 URI 조각입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

modelVersion

string

AI Services Vision 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

VisualFeature

반환할 시각적 기능 유형을 나타내는 문자열입니다.

Description
adult

성인으로 인식되는 시각적 기능입니다.

brands

상업용 브랜드로 인식되는 시각적 기능입니다.

categories

카테고리.

description

묘사.

faces

사람 얼굴로 인식되는 시각적 기능입니다.

objects

개체로 인식되는 시각적 기능입니다.

tags

태그.

WebApiSkill

Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다.

Name 형식 Description
@odata.type string:

#Microsoft.Skills.Custom.WebApiSkill

기술 유형을 지정하는 URI 조각입니다.

authIdentity SearchIndexerDataIdentity:

아웃바운드 연결에 사용되는 사용자 할당 관리 ID입니다. authResourceId가 제공되고 지정되지 않은 경우 시스템 할당 관리 ID가 사용됩니다. 인덱서 업데이트 시 ID가 지정되지 않은 경우 값은 변경되지 않은 상태로 유지됩니다. "none"으로 설정하면 이 속성의 값이 지워집니다.

authResourceId

string

Azure 함수 또는 변환을 제공하는 다른 애플리케이션의 외부 코드에 연결하는 사용자 지정 기술에 적용됩니다. 이 값은 함수 또는 앱이 Azure Active Directory에 등록되었을 때 만든 애플리케이션 ID여야 합니다. 지정된 경우 사용자 지정 기술은 검색 서비스의 관리 ID(시스템 또는 사용자 할당)와 함수 또는 앱의 액세스 토큰을 사용하여 함수 또는 앱에 연결합니다. 이 값을 액세스 토큰의 범위를 만들기 위한 리소스 ID로 사용합니다.

batchSize

integer (int32)

문서 수를 나타내는 원하는 일괄 처리 크기입니다.

context

string

문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.

degreeOfParallelism

integer (int32)

설정된 경우 Web API에 대해 수행할 수 있는 병렬 호출 수입니다.

description

string

기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.

httpHeaders

object

http 요청을 만드는 데 필요한 헤더입니다.

httpMethod

string

http 요청에 대한 메서드입니다.

inputs

InputFieldMappingEntry[]

기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.

name

string

기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다.

outputs

OutputFieldMappingEntry[]

기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.

timeout

string (duration)

요청에 대해 원하는 시간 제한입니다. 기본값은 30초입니다.

uri

string

Web API의 URL입니다.