O que é a Tradução de Documentos?
A Tradução de Documentos é um recurso de tradução automática baseado em nuvem do serviço Azure AI Translator . Você pode traduzir vários documentos complexos em todos os idiomas e dialetos suportados, preservando a estrutura original do documento e o formato de dados. A API de tradução de documentos suporta dois processos de tradução:
A tradução assíncrona em lote suporta o processamento de vários documentos e arquivos grandes. O processo de tradução em conjunto requer uma conta de armazenamento de Blobs do Azure com contentores de armazenamento para os seus documentos de origem e traduzidos.
O arquivo único síncrono suporta o processamento de traduções de arquivo único. O processo de tradução de arquivos não requer uma conta de armazenamento de Blob do Azure. A resposta final contém o documento traduzido e é devolvida diretamente ao cliente chamador.
Tradução em lote assíncrona
Use o processamento assíncrono de documentos para traduzir vários documentos e arquivos grandes.
Principais recursos do lote
Funcionalidade | Description |
---|---|
Traduzir arquivos grandes | Traduza documentos inteiros de forma assíncrona. |
Traduzir inúmeros arquivos | Traduza vários arquivos em todos os idiomas e dialetos suportados, preservando a estrutura do documento e o formato de dados. |
Preservar a apresentação do arquivo de origem | Traduza arquivos preservando o layout e o formato originais. |
Aplicar tradução personalizada | Traduza documentos usando modelos de tradução gerais e personalizados. |
Aplicar glossários personalizados | Traduza documentos usando glossários personalizados. |
Detetar automaticamente o idioma do documento | Deixe que o serviço de Tradução de Documentos determine o idioma do documento. |
Traduzir documentos com conteúdo em vários idiomas | Use o recurso de deteção automática para traduzir documentos com conteúdo em vários idiomas para o idioma de destino. |
Opções de desenvolvimento em lote
Você pode adicionar a Tradução de Documentos aos seus aplicativos usando a API REST ou um SDK de biblioteca cliente:
A API REST. é uma interface agnóstica de linguagem que permite criar solicitações HTTP e cabeçalhos de autorização para traduzir documentos.
Os SDKs de biblioteca de cliente são classes, objetos, métodos e código específicos do idioma que você pode usar rapidamente adicionando uma referência em seu projeto. Atualmente a Tradução de Documentos tem suporte à linguagem de programação para C#/.NET e Python.
Formatos de documentos suportados em lote
O método Get supported document formats devolve uma lista de formatos de documentos suportados pelo serviço de Tradução de Documentos. A lista inclui a extensão de arquivo comum e o tipo de conteúdo se estiver usando a API de carregamento.
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Adobe PDF | pdf |
Formato de arquivo de documento portátil. A tradução de documentos usa a tecnologia de reconhecimento ótico de caracteres (OCR) para extrair e traduzir texto em documento PDF digitalizado, mantendo o layout original. |
Valores separados por vírgulas | csv |
Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha. |
HTML | html , htm |
Linguagem de marcação de hipertexto. |
Formato de arquivo de intercâmbio de localização | XLF | Um formato de documento paralelo, exportação de sistemas de memória de tradução. As línguas utilizadas são definidas dentro do ficheiro. |
Markdown | markdown , mdown , mkdn , , md , mdwn mkd , mdtxt , mdtext ,rmd |
Uma linguagem de marcação leve para criar texto formatado. |
MHTML | mthml , mht |
Um formato de arquivo de página da Web usado para combinar código HTML e seus recursos complementares. |
Microsoft Excel | xls , xlsx |
Um arquivo de planilha para análise de dados e documentação. |
Microsoft Outlook | msg |
Uma mensagem de email criada ou salva no Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
Um arquivo de apresentação usado para exibir conteúdo em um formato de apresentação de slides. |
Microsoft Word | doc , docx |
Um arquivo de documento de texto. |
Texto OpenDocument | odt |
Um ficheiro de documento de texto de código aberto. |
Apresentação OpenDocument | odp |
Um arquivo de apresentação de código aberto. |
Folha de cálculo OpenDocument | ods |
Um ficheiro de folha de cálculo de código aberto. |
Formato Rich Text | rtf |
Um documento de texto que contém formatação. |
Valores separados por tabulação/TAB | tsv /tab |
Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha. |
Texto | txt |
Um documento de texto não formatado. |
Tipos de arquivo herdados em lote
Os tipos de arquivo de origem são preservados durante a tradução do documento, com as seguintes exceções:
Extensão do arquivo de origem | Extensão de arquivo traduzido |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Formatos de glossário suportados por lote
A Tradução de Documentos suporta os seguintes tipos de ficheiros de glossário:
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Valores separados por vírgulas | csv |
Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha. |
Formato de arquivo de intercâmbio de localização | xlf , xliff |
Um formato de documento paralelo, exportação de sistemas de memória de tradução As línguas utilizadas são definidas dentro do ficheiro. |
Valores separados por tabulações/TAB | tsv , tab |
Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha. |
Tradução síncrona
Use o processamento de tradução síncrona para enviar um documento como parte do corpo da solicitação HTTP e receber o documento traduzido na resposta HTTP.
Principais recursos de tradução síncrona
Funcionalidade | Description |
---|---|
Traduzir arquivos de página única | A solicitação síncrona aceita apenas um único documento como entrada. |
Preservar a apresentação do arquivo de origem | Traduza arquivos preservando o layout e o formato originais. |
Aplicar tradução personalizada | Traduza documentos usando modelos de tradução gerais e personalizados. |
Aplicar glossários personalizados | Traduza documentos usando glossários personalizados. |
Tradução em língua única | Traduza de e para um idioma suportado. |
Detetar automaticamente o idioma do documento | Deixe que o serviço de Tradução de Documentos determine o idioma do documento. |
Aplicar glossários personalizados | Traduzir um documento usando um glossário personalizado. |
Formatos de documentos síncronos suportados
Tipo de ficheiro | Extensão de nome de ficheiro | Tipo do conteúdo | Description |
---|---|---|---|
Texto simples | .txt |
text/plain |
Um documento de texto não formatado. |
Valores separados por tabulação | .txv .tab |
text/tab-separated-values |
Um formato de arquivo de texto que usa guias para separar valores e novas linhas para separar registros. |
Valores separados por vírgulas | .csv |
text/csv |
Um formato de arquivo de texto que usa vírgulas como um delimitador entre valores. |
Linguagem de marcação de hipertexto | .html .htm |
text/html |
HTML é uma linguagem de marcação padrão usada para estruturar páginas da web e conteúdo. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Um formato de arquivo de página da Web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Um formato de arquivo baseado em XML usado para apresentações de slides do PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Um formato de arquivo baseado em XML usado para planilhas do Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Um formato de arquivo baseado em XML usado para documentos do Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Um formato de arquivo usado para objetos de mensagem de email do Outlook armazenados. |
Intercâmbio de localização XML | .xlf .xliff |
application/xliff+xml |
Um formato de arquivo padronizado baseado em XML amplamente utilizado no processamento de software de tradução e localização. |
Formatos de glossário síncronos suportados
A Tradução de Documentos suporta os seguintes tipos de ficheiros de glossário:
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Valores separados por vírgulas | csv |
Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha. |
XmlLocalizationInterchange | xlf , xliff |
Um formato baseado em XML projetado para padronizar como os dados são passados durante o processo de localização. |
TabSeparatedValues | tsv , tab |
Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha. |
Limites de Pedidos de Tradução de Documentos
Para obter informações detalhadas sobre os limites de solicitação do Serviço Azure AI Translator, consulte Limites de solicitação de tradução de documentos.
Residência de dados de tradução de documentos
A residência de dados da Tradução de Documentos depende da região do Azure onde o recurso do Translator foi criado:
✔️ Funcionalidade: Ponto de extremidade do Serviço de Tradução ✔️
de Documentos: Personalizado: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Região criada pelo recurso | Centro de dados de processamento de pedidos |
---|---|
A nível mundial | Data center disponível mais próximo. |
Américas | Leste dos EUA 2 • Oeste dos EUA 2 |
Ásia-Pacífico | Leste do Japão • Sudeste Asiático |
Europa (exceto Suíça) | França Central • Europa Ocidental |
Suíça | Suíça Norte • Suíça Oeste |
Próximos passos
Em nosso guia de início rápido, você aprende como começar a usar rapidamente a Tradução de Documentos. Para começar, você precisa de uma conta ativa do Azure. Se não tiver uma, poderá criar uma conta gratuita.