텍스트 번역 인지 기술
텍스트 번역 기술은 텍스트를 평가하고 각 레코드에 대해 지정된 대상 언어로 번역된 텍스트를 반환합니다. 이 기술은 Azure AI 서비스에서 사용할 수 있는 Translator Text API v3.0을 사용합니다.
이 기능은 문서가 모두 한 언어로 되어 있지 않을 것으로 예상되는 경우 유용합니다. 이 경우 텍스트를 번역하여 검색을 인덱싱하기 전에 단일 언어로 정규화할 수 있습니다. 동일한 텍스트의 복사본을 여러 언어로 제공하는 지역화 사용 사례에도 유용합니다.
Translator Text API v3.0은 비지역 Azure AI 서비스입니다. 즉, 데이터가 Azure AI Search 또는 연결된 Azure AI 서비스 리소스와 동일한 지역에 유지되도록 보장되지 않습니다.
참고 항목
이 기술은 Azure AI 서비스에 바인딩되며, 하루에 인덱서당 20개의 문서를 초과하는 트랜잭션에 대해 청구 가능한 리소스를 필요로 합니다. 기본 제공 기술을 실행하는 요금은 기존 Azure AI 서비스 종량제 가격으로 청구됩니다.
이 기술을 사용하는 경우 원본 및 대상 언어가 동일한 경우에도 원본의 모든 문서가 처리되고 번역 요금이 청구됩니다. 이 동작은 동일한 문서 내의 다국어 지원에 유용하지만 불필요한 처리가 발생할 수 있습니다. 처리할 필요가 없는 문서에서 예기치 않은 청구 요금을 방지하려면 기술을 실행하기 전에 데이터 원본 컨테이너에서 이동합니다.
@odata.type
Microsoft.Skills.Text.TranslationSkill
데이터 제한
레코드의 최대 크기는 String.Length
에 의해 측정된 대로 50,000자여야 합니다. 텍스트 번역 기술로 보내기 전에 데이터를 분할해야 할 경우 텍스트 나누기 기술 사용을 고려합니다. 텍스트 분할 기술을 사용하는 경우 최상의 성능을 위해 페이지 길이를 5000으로 설정합니다.
기술 매개 변수
매개 변수는 대/소문자를 구분합니다.
입력 | 설명 |
---|---|
defaultToLanguageCode | (필수) "to" 언어를 명시적으로 지정하지 않는 문서에 대해 문서를 번역할 언어 코드입니다. 지원되는 언어 전체 목록을 참조하세요. |
defaultFromLanguageCode | (선택 사항) "from" 언어를 명시적으로 지정하지 않는 문서에 대해 문서를 번역할 언어 코드입니다. defaultFromLanguageCode가 지정되지 않은 경우 Translator Text API에서 제공하는 자동 언어 감지를 사용하여 "from" 언어를 결정합니다. 지원되는 언어 전체 목록을 참조하세요. |
suggestedFrom | (선택 사항) fromLanguageCode 또는 defaultFromLanguageCode 가 지정되지 않고, 자동 언어 검색이 실패하는 경우 문서를 번역할 언어 코드입니다. suggestedFrom 언어가 지정되지 않은 경우 영어(en)가 suggestedFrom 언어로 사용됩니다. 지원되는 언어 전체 목록을 참조하세요. |
기술 입력
입력 이름 | 설명 |
---|---|
text | 번역할 텍스트입니다. |
toLanguageCode | 텍스트를 번역해야 하는 언어를 나타내는 문자열입니다. 이 입력을 지정하지 않으면 defaultToLanguageCode가 텍스트 번역에 사용됩니다. 지원되는 언어 전체 목록을 참조하세요. |
fromLanguageCode | 텍스트의 현재 언어를 나타내는 문자열입니다. 이 매개 변수를 지정하지 않으면 defaultFromLanguageCode(또는 defaultFromLanguageCode가 제공되지 않는 경우 자동 언어 감지)가 텍스트 번역에 사용됩니다. 지원되는 언어 전체 목록을 참조하세요. |
기술 출력
출력 이름 | 설명 |
---|---|
translatedText | translationedFromLanguageCode에서 translationedToLanguageCode로의 텍스트 번역의 문자열 결과입니다. |
translatedToLanguageCode | 텍스트가 번역된 언어 코드를 나타내는 문자열입니다. 여러 언어로 번역하고 어떤 텍스트가 어떤 언어에 대응하는지 지속적으로 확인하려는 경우에 유용합니다. |
translatedFromLanguageCode | 텍스트가 번역된 언어 코드를 나타내는 문자열입니다. 자동 언어 감지 옵션을 선택한 경우 이 출력이 해당 검색 결과를 제공하므로 유용합니다. |
샘플 정의
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
샘플 입력
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
샘플 출력
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
오류 및 경고
"to" 또는 "from" 언어에 대해 지원되지 않는 언어 코드를 제공하면 오류가 발생하고 텍스트가 번역되지 않습니다. 텍스트가 비어 있는 경우 경고가 생성됩니다. 텍스트가 50,000자보다 큰 경우 처음 50,000자만 번역되고 경고가 발생합니다.