O que é a Tradução de Documento?
A Tradução de documentos é um recurso de tradução automática baseado em nuvem do serviço Tradutor de IA do Azure. Você pode traduzir vários e complexos documentos em todos os idiomas e dialetos compatíveis, preservando a estrutura original do documento e o formato de dados. A API da tradução de documento aceita dois processos de tradução:
A tradução assíncrona em lote aceita o processamento de vários documentos e arquivos grandes. O processo de tradução em lote exige uma conta de armazenamento de Blobs do Azure com contêineres de armazenamento para seus documentos originais e traduzidos.
O arquivo único síncrono aceita o processamento de traduções de arquivo único. O processo de tradução de arquivo não requer uma conta de armazenamento de Blobs do Azure. A resposta final contém o documento traduzido e é retornada diretamente ao cliente que está fazendo a chamada.
Tradução em lote assíncrona
Use o processamento assíncrono de documentos para traduzir vários documentos e arquivos grandes.
Principais funcionalidades do lote
Recurso | Descrição |
---|---|
Traduzir grandes arquivos | Traduza documentos inteiros de forma assíncrona. |
Traduzir vários arquivos | Traduza vários arquivos em todos os idiomas e dialetos compatíveis e, ao mesmo tempo, preserve a estrutura do documento e o formato dos dados. |
Preservar a apresentação do arquivo de origem | Traduza os arquivos, mas preservando o layout e o formato originais. |
Aplicar tradução personalizada | Traduza documentos com modelos de tradução personalizada e geral. |
Aplicar glossários personalizados | Traduza documentos usando glossários personalizados. |
Detectar o idioma do documento automaticamente | Deixe o serviço de Tradução de Documentos determinar o idioma do documento. |
Traduza documentos com conteúdo em vários idiomas | Use o recurso de detecção automática para traduzir documentos com o conteúdo em vários idiomas para o idioma de destino. |
Opções de desenvolvimento do lote
Você pode adicionar a tradução de documento aos seus aplicativos usando a API REST ou um SDK da biblioteca de clientes:
A API REST. é uma interface independente de linguagem que permite que você crie solicitações HTTP e cabeçalhos de autorização para traduzir documentos.
Os SDKs da biblioteca de clientes são classes, objetos, métodos e códigos específicos da linguagem que você pode usar rapidamente adicionando uma referência ao seu projeto. Atualmente, a tradução de documento tem suporte de linguagem de programação para C#/.NET e Python.
Formatos de documento compatíveis com o lote
O método Obter formatos de documento com suporte retorna uma lista de formatos de documento compatíveis com o serviço Tradução de Documento. A lista inclui a extensão de arquivo comum e o tipo de conteúdo se estiver usando a API de upload.
Tipo de arquivo | Extensão de arquivo | Descrição |
---|---|---|
Adobe PDF | pdf |
Formato de arquivo de documento portátil. A Tradução de Documento usa a tecnologia de OCR (reconhecimento óptico de caracteres) para extrair e traduzir texto em documentos PDF digitalizados, mantendo o layout original. |
Valores separados por vírgula | csv |
Um arquivo de dados brutos delimitado por vírgula usado por programas de planilha. |
HTML | html , htm |
Linguagem HTML. |
Formato de arquivo de intercâmbio de localização | xlf | Um formato de documento paralelo, exportação de sistemas de Memória de Tradução. Os idiomas utilizados são definidos dentro do arquivo. |
Markdown | markdown , mdown , mkdn , md , mkd , mdwn , mdtxt , mdtext , rmd |
Um idioma de marcação leve para criar texto formatado. |
MHTML | mthml , mht |
Um formato de camada de arquivos da página da Web usado para combinar o código HTML e seus recursos complementares. |
Microsoft Excel | xls , xlsx |
Um arquivo de planilha para análise de dados e documentação. |
Microsoft Outlook | msg |
Uma mensagem de email criada ou salva no Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
Um arquivo de apresentação usado para exibir conteúdo em um formato de apresentação de slides. |
Microsoft Word | doc , docx |
Um arquivo de documento de texto. |
Texto OpenDocument | odt |
Um arquivo de documento de texto de software livre. |
Apresentação OpenDocument | odp |
Um arquivo de apresentação de software livre. |
Planilha OpenDocument | ods |
Um arquivo de planilha de software livre. |
Formato Rich Text | rtf |
Um documento de texto que contém formatação. |
Valores separados por tabulação/TAB | tsv /tab |
Um arquivo de dados brutos delimitado por tabulação usado por programas de planilha. |
Texto | txt |
Um documento de texto não formatado. |
Tipos de arquivo herdados do lote
Os tipos de arquivo de origem são preservados durante a tradução de documento com as seguintes exceções:
Extensão do arquivo de origem | Extensão do arquivo convertida |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Formatos de glossário compatíveis com o lote
A Tradução de Documento dá suporte aos seguintes tipos de arquivo de glossário:
Tipo de arquivo | Extensão de arquivo | Descrição |
---|---|---|
Valores Separados por Vírgula | csv |
Um arquivo de dados brutos delimitado por vírgula usado por programas de planilha. |
Formato de arquivo de intercâmbio de localização | xlf , xliff |
Um formato de documento paralelo, exportação de sistemas de memória de tradução. Os idiomas usados são definidos dentro do arquivo. |
Valores separados por tabulação/TAB | tsv , tab |
Um arquivo de dados brutos delimitado por tabulação usado por programas de planilha. |
Tradução síncrona
Use o processamento de tradução síncrona para enviar um documento como parte do corpo da solicitação HTTP e receber o documento traduzido na resposta HTTP.
Principais funcionalidades da tradução síncrona
Recurso | Descrição |
---|---|
Traduzir arquivos de página única | A solicitação síncrona aceita apenas um único documento como entrada. |
Preservar a apresentação do arquivo de origem | Traduza os arquivos, mas preservando o layout e o formato originais. |
Aplicar tradução personalizada | Traduza documentos com modelos de tradução personalizada e geral. |
Aplicar glossários personalizados | Traduza documentos usando glossários personalizados. |
Tradução para um único idioma | Traduzir de e para um idioma com suporte. |
Detectar o idioma do documento automaticamente | Deixe o serviço de Tradução de Documentos determinar o idioma do documento. |
Aplicar glossários personalizados | Traduzir um documento usando um glossário personalizado. |
Formatos de documentos compatíveis para sincronização
Tipo de arquivo | Extensão de arquivo | Tipo de conteúdo | Descrição |
---|---|---|---|
Texto sem Formatação | .txt |
text/plain |
Um documento de texto não formatado. |
Valores Separados por Tabulações | .txv .tab |
text/tab-separated-values |
Um formato de arquivo de texto que usa tabulações para separar valores e novas linhas para separar registros. |
Valores Separados por Vírgulas | .csv |
text/csv |
Um formato de arquivo de texto que usa vírgulas como um delimitador entre valores. |
Linguagem de Marcação de Hipertexto | .html .htm |
text/html |
HTML é uma linguagem de marcação padrão usada para estruturar páginas e conteúdo da Web. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Um formato de arquivo de página da Web. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Um formato de arquivo baseado em XML usado para apresentações de slides do PowerPoint. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Um formato de arquivo baseado em XML usado para planilhas do Excel. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Um formato de arquivo baseado em XML usado para documentos do Word. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Um formato de arquivo usado para armazenar objetos de mensagem de email do Outlook. |
Intercâmbio de Localização Xml | .xlf .xliff |
application/xliff+xml |
Um formato de arquivo padronizado baseado em XML amplamente usado no processamento de software de tradução e localização. |
Formatos de glossário com suporte síncrono
A Tradução de Documento dá suporte aos seguintes tipos de arquivo de glossário:
Tipo de arquivo | Extensão de arquivo | Descrição |
---|---|---|
Valores Separados por Vírgula | csv |
Um arquivo de dados brutos delimitado por vírgula usado por programas de planilha. |
XmlLocalizationInterchange | xlf , xliff |
Um formato baseado em XML projetado para padronizar a forma como os dados são transmitidos durante o processo de localização. |
TabSeparatedValues | tsv , tab |
Um arquivo de dados brutos delimitado por tabulação usado por programas de planilha. |
Limites de Solicitação de Tradução de Documentos
Para obter informações detalhadas sobre os limites da solicitação do Serviço Tradutor de IA do Azure, confira Limites de solicitação de tradução de documentos.
Residência de dados de Tradução de Documento
A residência de dados de Tradução de Documento depende da região do Azure em que o recurso de Tradução foi criado:
✔️ Recurso: Tradução de documento
✔️ Ponto de extremidade de serviço: Personalizado: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Região criada pelo recurso | Data center de processamento de solicitações |
---|---|
Global | Data center disponível mais próximo. |
Américas | Leste dos EUA 2 • Oeste dos EUA 2 |
Pacífico Asiático | Leste do Japão • Sudeste da Ásia |
Europa (exceto Suíça) | França Central • Oeste da Europa |
Suíça | Norte da Suíça • Oeste da Suíça |
Próximas etapas
Em nosso início rápido, você começará a usar a Tradução de Documento rapidamente. Para começar, você precisará de uma conta do Azure ativa. Se você não tiver uma, poderá criar uma conta gratuita.