Partilhar via


Requisitos e limitações para modelos no Microsoft Syntex

Aplica-se a: ✓ Todos os modelos personalizados | ✓ Todos os modelos pré-criados

Microsoft Syntex permite-lhe criar modelos personalizados e modelos pré-criados. Consoante o tipo de modelo que escolher, poderão existir diferentes requisitos, como o tipo e o tamanho do ficheiro, idiomas que têm de ser suportados, considerações geográficas e outros fatores que o ajudarão a decidir que tipo de modelo utilizar.

Modelos personalizados:

Modelos pré-criados:

Modelos personalizados

Processamento de documentos não estruturados

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls e .xlsx ( as fórmulas nos ficheiros .xls e .xlsx não são executadas).
Símbolo de conversação. Idiomas suportados
Este modelo suporta todos os idiomas baseados no latim, incluindo: inglês, francês, alemão, italiano e espanhol.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem os seguintes requisitos:
- Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres.
- Se os seus ficheiros de .pdf estiverem bloqueados por palavra-passe, tem de remover o bloqueio antes de os submeter.
- O tamanho de ficheiro combinado dos documentos utilizados para preparação por coleção não pode exceder os 50 MB e os documentos PDF não devem ter mais de 500 páginas.
- Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis. As imagens muito largas ou com dimensões ímpares (por exemplo, plantas dos pisos) podem ficar truncadas no processo OCR e perder a precisão.
- Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores.
- Se forem analisadas a partir de documentos em papel, as análises devem ser imagens de alta qualidade.
- Tem de utilizar o alfabeto latino (carateres em inglês).
Tenha em atenção as seguintes diferenças sobre ficheiros baseados em texto do Microsoft Office e ficheiros analisados pelo OCR (.pdf, imagem ou .tiff):
- Todos os ficheiros: truncados com 64 000 carateres (em preparação e quando executados em ficheiros numa biblioteca de documentos).
- Ficheiros analisados pelo OCR: existe um limite de 500 páginas. Apenas os tipos de ficheiros pdf e de imagem são processados pelo OCR.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado.

Processamento de documentos de forma livre

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: ver requisitos de tipo de ficheiro.
Símbolo de conversação. Idiomas suportados
Este modelo suporta os seguintes idiomas: veja Modelo para Documentos gerais.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem estes requisitos.
Símbolo de largura de banda/eficiência. Sugestões de otimização
Se o modelo não estiver a funcionar como pretende, experimente estes passos para melhorar o desempenho do modelo.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de blocos. Ambientes personalizados do Power Platform
Se utilizar um ambiente personalizado (em vez do ambiente predefinido) para o processamento do Power Platform, existem requisitos de configuração adicionais. Para obter mais informações, veja Ambientes personalizados do Power Platform.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. Só pode ter um modelo de forma livre ou um modelo estruturado por biblioteca.

Processamento de documentos estruturados

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: ver requisitos de tipo de ficheiro.
Símbolo de conversação. Idiomas suportados
Este modelo suporta os seguintes idiomas: veja Modelo para documentos de modelo fixo.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem estes requisitos.
Símbolo de largura de banda/eficiência. Sugestões de otimização
Se o modelo não estiver a funcionar como pretende, experimente estes passos para melhorar o desempenho do modelo.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de blocos. Ambientes personalizados do Power Platform
Se utilizar um ambiente personalizado (em vez do ambiente predefinido) para o processamento do Power Platform, existem requisitos de configuração adicionais. Para obter mais informações, veja Ambientes personalizados do Power Platform.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado. Só pode ter um modelo de forma livre ou um modelo estruturado por biblioteca.

Modelos pré-construídos

Processamento de contratos

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff.
Símbolo de conversação. Idiomas suportados
Este modelo suporta apenas contratos de idioma em inglês.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem os seguintes requisitos:
- Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres.
- Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas.
- O tamanho do ficheiro tem de ser inferior a 50 MB.
- Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis.
- Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores.
- O tamanho total dos dados de preparação é de 500 páginas ou menos.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado.

Processamento de faturas

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff.
Símbolo de conversação. Idiomas suportados
Este modelo suporta faturas em inglês, espanhol, alemão, francês, italiano, português e neerlandês.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem os seguintes requisitos:
- Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres.
- Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas.
- O tamanho do ficheiro tem de ser inferior a 50 MB.
- Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis.
- Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores.
- O tamanho total dos dados de preparação é de 500 páginas ou menos.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado.

Processamento de recibos

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff.
Símbolo de conversação. Idiomas suportados
Este modelo suporta recibos em inglês, croação, checo, dinamarquês, neerlandês, finlandês, alemão, húngaro, italiano, japonês, letão, lituano, norueguês, português, espanhol, sueco e vietnamita.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem os seguintes requisitos:
- Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres.
- Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas.
- O tamanho do ficheiro tem de ser inferior a 50 MB.
- Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis.
- Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores.
- O tamanho total dos dados de preparação é de 500 páginas ou menos.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado.

Processamento de informações confidenciais

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls e .xlsx.
Símbolo de conversação. Idiomas suportados
Este modelo suporta os seguintes idiomas: veja os idiomas suportados.
Este modelo também suporta idiomas para texto manuscrito e texto de impressão.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem os seguintes requisitos:
- Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres.
- Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas.
- O tamanho do ficheiro tem de ser inferior a 50 MB.
- Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis.
- Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores.
- O tamanho total dos dados de preparação é de 500 páginas ou menos.
Suporta idiomas para texto manuscrito e texto de impressão.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado.

Processamento de documentos simples

Ícone Descrição
Símbolo de ficheiros. Tipos de ficheiros suportados
Este modelo suporta os seguintes tipos de ficheiro: .bmp, .jpeg, .pdf, .png e .tiff.
Símbolo de conversação. Idiomas suportados
Este modelo suporta documentos em mais de 100 idiomas.
Símbolo de parágrafo. Considerações sobre o OCR
Este modelo utiliza tecnologia de reconhecimento ótico de carateres (OCR) para analisar ficheiros de .pdf, ficheiros de imagem e ficheiros de .tiff. O processamento de OCR funciona melhor em documentos que cumprem os seguintes requisitos:
- Formato de ficheiro de .jpg, .png ou .pdf (texto ou digitalizado). Os ficheiros de .pdf incorporados em texto são melhores, uma vez que não haverá erros na extração e localização de carateres.
- Para .pdf e .tiff ficheiros, podem ser processadas até 2000 páginas.
- O tamanho do ficheiro tem de ser inferior a 50 MB.
- Para imagens, as dimensões têm de estar entre 50 x 50 e 10 000 x 10 000 pixéis.
- Para .pdf ficheiros, as dimensões têm de ter, no máximo, 11 x 17 polegadas, correspondentes a tamanhos de papel Legal ou A3 e menores.
- O tamanho total dos dados de preparação é de 500 páginas ou menos.
Símbolo de globo. Ambientes Multi-Geo
Ao configurar o Syntex num ambiente Do Microsoft 365 Multi-Geo , só pode configurá-lo para utilizar o tipo de modelo na localização central. Se quiser utilizar este tipo de modelo numa localização por satélite, contacte o suporte da Microsoft.
Símbolo de objetos. Bibliotecas de vários modelos
Se dois ou mais modelos preparados forem aplicados à mesma biblioteca, o ficheiro é classificado com o modelo que tem a classificação de confiança média mais alta. As entidades extraídas serão apenas do modelo aplicado.