Compartir a través de


Requisitos y limitaciones para el procesamiento de documentos precompilados en SharePoint

En las secciones siguientes se describen los factores clave que se deben tener en cuenta al planear el uso de un modelo de procesamiento de documentos precompilado.

Procesamiento del contrato

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo solo admite contratos en inglés.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas son solo del modelo aplicado.

Procesamiento de facturas

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo admite facturas en inglés, español, alemán, francés, italiano, portugués y holandés.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas son solo del modelo aplicado.

Procesamiento de recibos

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo admite recibos en inglés, croata, checo, danés, holandés, finlandés, alemán, húngaro, italiano, japonés, letón, lituano, noruego, portugués, español, sueco y vietnamita.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas son solo del modelo aplicado.

Procesamiento de información confidencial

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls y .xlsx.
Símbolo de conversación. Idiomas admitidos
Este modelo admite los siguientes idiomas: consulte los idiomas admitidos.
Este modelo también admite idiomas tanto para texto manuscrito como para texto impreso.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Admite idiomas tanto para texto manuscrito como para texto impreso.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas son solo del modelo aplicado.

Procesamiento simple de documentos

Icono Descripción
Símbolo de archivos. Tipos de archivo admitidos
Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff.
Símbolo de conversación. Idiomas admitidos
Este modelo admite documentos en más de 100 idiomas.
Símbolo de párrafo. Consideraciones de OCR
Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos:
- Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres.
- Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas.
- El tamaño del archivo debe ser inferior a 50 MB.
- Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
- Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
Símbolo de globo. Entornos de Multi-Geo
Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft.
Símbolo de objetos. Bibliotecas multimodelo
Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas son solo del modelo aplicado.