Habilidade cognitiva de tradução de texto
A Tradução de Texto é uma habilidade cognitiva usada durante a indexação que avalia o texto e, para cada registro, retorna o texto traduzido para o idioma de destino especificado. Essa habilidade usa a API de Tradução de Texto v3.0 disponível nos Serviços de IA do Azure.
Esse recurso é útil se você espera que seus documentos não estejam em um idioma, caso em que você pode normalizar o texto para uma única lingua antes de indexar a pesquisa, traduzindo-o. Ele também é útil para casos de uso de localização, onde talvez você queira ter cópias do mesmo texto disponíveis em vários idiomas.
A API de Tradução de Texto v3.0 é um Serviço de a IA do Azure não regional, o que significa que não há garantia de que seus dados permaneçam na mesma região que sua IA do Azure Search ou recurso de serviços de IA do Azure anexado.
Observação
Essa habilidade está associada aos serviços de IA do Azure e requer um recurso faturável para transações que excedem 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pago conforme o uso dos serviços de IA do Azure existentes.
Quando essa habilidade é usada, todos os documentos na origem são processados e cobrados pela tradução, mesmo que os idiomas de origem e de destino sejam os mesmos. Esse comportamento é útil para suporte a vários idiomas no mesmo documento, mas pode resultar em um processamento desnecessário. Para evitar cobranças inesperadas de documentos que não precisam de processamento, mova-os para fora do contêiner da fonte de dados antes de executar a habilidade.
@odata.type
Microsoft.Skills.Text.TranslationSkill
Limites de dados
O tamanho máximo de um registro deve ser de 50.000 caracteres conforme medido por String.Length
. Se você precisar interromper o backup de seus dados antes de enviá-la para o extrator de frases-chave, considere o uso de habilidade de Texto Dividido. Se você usar uma habilidade de divisão de texto, defina o comprimento da página como 5000 para obter o melhor desempenho.
Parâmetros de habilidades
Os parâmetros diferenciam maiúsculas de minúsculas.
Entradas | Descrição |
---|---|
defaultToLanguageCode | (Obrigatório) O código de idioma de destino para tradução dos documentos que não especificam explicitamente esse idioma. Consulte a Lista completa dos idiomas com suporte. |
defaultFromLanguageCode | (Opcional) O código do idioma de origem para tradução dos documentos que não especificam explicitamente esse idioma. Se defaultFromLanguageCode não for especificado, a detecção automática de idiomas fornecida pela API de Tradução de Texto será usada para determinar o idioma de origem. Consulte a Lista completa dos idiomas com suporte. |
suggestedFrom | (Opcional) O código do idioma de origem para tradução se fromLanguageCode ou defaultFromLanguageCode não são especificados, e a detecção automática de idiomas não é bem-sucedida. Se o idioma suggestedFrom não for especificado, inglês (en) será usado como o idioma suggestedFrom. Consulte a Lista completa dos idiomas com suporte. |
Entradas de habilidades
Nome de entrada | Descrição |
---|---|
texto | O texto a ser traduzido. |
toLanguageCode | Uma cadeia de caracteres que indica o idioma no qual o texto deve ser convertido. Se essa entrada não for especificada, defaultToLanguageCode será usado para traduzir o texto. Consulte a Lista completa dos idiomas com suporte. |
fromLanguageCode | Uma cadeia de caracteres que indica o idioma dos registros. Se esse parâmetro não for especificado, defaultFromLanguageCode (ou a detecção automática de idioma se defaultFromLanguageCode não for fornecido) será usado para traduzir o texto. Consulte a Lista completa dos idiomas com suporte. |
Saídas de habilidades
Nome de saída | Descrição |
---|---|
translatedText | O resultado da cadeia de caracteres da conversão de texto do translatedFromLanguageCode para o translatedToLanguageCode. |
translatedToLanguageCode | Uma cadeia de caracteres que indica o código de idioma para o qual o texto foi traduzido. Útil se você estiver traduzindo para vários idiomas e quiser poder controlar qual texto está em cada idioma. |
translatedFromLanguageCode | Uma cadeia de caracteres que indica o código de idioma do qual o texto foi traduzido. Útil se você optou pela opção de detecção automática de idioma, pois essa saída fornecerá o resultado dessa detecção. |
Definição de exemplo
{
"@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
"defaultToLanguageCode": "fr",
"suggestedFrom": "en",
"context": "/document",
"inputs": [
{
"name": "text",
"source": "/document/text"
}
],
"outputs": [
{
"name": "translatedText",
"targetName": "translatedText"
},
{
"name": "translatedFromLanguageCode",
"targetName": "translatedFromLanguageCode"
},
{
"name": "translatedToLanguageCode",
"targetName": "translatedToLanguageCode"
}
]
}
Entrada de exemplo
{
"values": [
{
"recordId": "1",
"data":
{
"text": "We hold these truths to be self-evident, that all men are created equal."
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
}
]
}
Saída de exemplo
{
"values": [
{
"recordId": "1",
"data":
{
"translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
"translatedFromLanguageCode": "en",
"translatedToLanguageCode": "fr"
}
},
{
"recordId": "2",
"data":
{
"translatedText": "Nous sommes très heureux d'être avec vous.",
"translatedFromLanguageCode": "es",
"translatedToLanguageCode": "fr"
}
}
]
}
Erros e avisos
Se você fornecer um código de idioma sem suporte para o idioma de origem ou destino, um erro será gerado e o texto não será traduzido. Se o texto estiver vazio, um aviso será gerado. Se o texto for maior que 50.000 caracteres, somente os primeiros 50.000 caracteres serão traduzidos e um aviso será emitido.