Requisitos y limitaciones para los modelos de Microsoft Syntex
Se aplica a: ✓ Todos los modelos personalizados | ✓ Todos los modelos precompilados
Microsoft Syntex permite crear modelos personalizados y modelos precompilados. En función del tipo de modelo que elija, puede haber diferentes requisitos, como el tipo de archivo y el tamaño, los idiomas que se deben admitir, las consideraciones geográficas y otros factores que le ayudarán a decidir qué tipo de modelo usar.
Modelos personalizados:
- Procesamiento de documentos no estructurados
- Procesamiento de documentos de forma libre
- Procesamiento estructurado de documentos
Modelos precompilados:
- Procesamiento del contrato
- Procesamiento de facturas
- Procesamiento de recibos
- Procesamiento de información confidencial
- Procesamiento simple de documentos
Modelos personalizados
Procesamiento de documentos no estructurados
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls y .xlsx (no se ejecutan fórmulas en los archivos .xls y .xlsx). |
|
Idiomas admitidos Este modelo es compatible con todos los idiomas latinos, incluidos inglés, francés, alemán, italiano y español. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos: - Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres. - Si los archivos de .pdf están bloqueados con contraseña, debe quitar el bloqueo antes de enviarlos. - El tamaño de archivo combinado de los documentos utilizados para el entrenamiento por colección no debe superar los 50 MB, y los documentos PDF no deben tener más de 500 páginas. - Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. Es posible que las imágenes muy anchas o con dimensiones inusuales (por ejemplo, planos de planta) se trunquen en el proceso de OCR y pierdan precisión. - Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños. - Si escaneó documentos en papel, los escaneos deben ser imágenes de alta calidad. - Debe usar el alfabeto latino (caracteres en inglés). Tenga en cuenta las siguientes diferencias sobre los archivos basados en texto de Microsoft Office y los archivos escaneados por OCR (.pdf, imagen o .tiff): - Todos los archivos: truncados con 64 000 caracteres (en entrenamiento y cuando se ejecutan en archivos de una biblioteca de documentos). - Archivos escaneados con OCR: hay un límite de 500 páginas. OCR solo procesa los tipos de archivo PDF y de imagen. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. |
Procesamiento de documentos de forma libre
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: consulte requisitos de tipo de archivo. |
|
Idiomas admitidos Este modelo admite los siguientes idiomas: vea Model for General documents (Modelo para documentos generales). |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen estos requisitos. |
|
Sugerencias de optimización Si el modelo no funciona como quiere, pruebe estos pasos para mejorar el rendimiento del modelo. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Entornos de Power Platform personalizados Si usa un entorno personalizado (en lugar del entorno predeterminado) para el procesamiento de Power Platform, hay requisitos de configuración adicionales. Para obtener más información, consulte Entornos de Power Platform personalizados. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. Solo puede tener una forma libre o un modelo estructurado por biblioteca. |
Procesamiento estructurado de documentos
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: consulte requisitos de tipo de archivo. |
|
Idiomas admitidos Este modelo admite los siguientes idiomas: consulte Modelo para documentos de plantilla fija. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen estos requisitos. |
|
Sugerencias de optimización Si el modelo no funciona como quiere, pruebe estos pasos para mejorar el rendimiento del modelo. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Entornos de Power Platform personalizados Si usa un entorno personalizado (en lugar del entorno predeterminado) para el procesamiento de Power Platform, hay requisitos de configuración adicionales. Para obtener más información, consulte Entornos de Power Platform personalizados. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. Solo puede tener una forma libre o un modelo estructurado por biblioteca. |
Modelos creados previamente
Procesamiento del contrato
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff. |
|
Idiomas admitidos Este modelo solo admite contratos en inglés. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos: - Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres. - Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas. - El tamaño del archivo debe ser inferior a 50 MB. - Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. - Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños. - El tamaño total de los datos de entrenamiento es de 500 páginas o menos. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. |
Procesamiento de facturas
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff. |
|
Idiomas admitidos Este modelo admite facturas en inglés, español, alemán, francés, italiano, portugués y holandés. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos: - Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres. - Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas. - El tamaño del archivo debe ser inferior a 50 MB. - Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. - Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños. - El tamaño total de los datos de entrenamiento es de 500 páginas o menos. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. |
Procesamiento de recibos
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff. |
|
Idiomas admitidos Este modelo admite recibos en inglés, croation, checo, danés, holandés, finlandés, alemán, húngaro, italiano, japonés, letón, lituano, noruego, portugués, español, sueco y vietnamita. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos: - Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres. - Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas. - El tamaño del archivo debe ser inferior a 50 MB. - Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. - Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños. - El tamaño total de los datos de entrenamiento es de 500 páginas o menos. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. |
Procesamiento de información confidencial
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls y .xlsx. |
|
Idiomas admitidos Este modelo admite los siguientes idiomas: consulte los idiomas admitidos. Este modelo también admite idiomas tanto para texto manuscrito como para texto impreso. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos: - Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres. - Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas. - El tamaño del archivo debe ser inferior a 50 MB. - Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. - Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños. - El tamaño total de los datos de entrenamiento es de 500 páginas o menos. Admite idiomas tanto para texto manuscrito como para texto impreso. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. |
Procesamiento simple de documentos
Icono | Descripción |
---|---|
Tipos de archivo admitidos Este modelo admite los siguientes tipos de archivo: .bmp, .jpeg, .pdf, .png y .tiff. |
|
Idiomas admitidos Este modelo admite documentos en más de 100 idiomas. |
|
Consideraciones de OCR Este modelo usa la tecnología de reconocimiento óptico de caracteres (OCR) para examinar archivos .pdf, archivos de imagen y archivos de .tiff. El procesamiento de OCR funciona mejor en documentos que cumplen los siguientes requisitos: - Formato de archivo de .jpg, .png o .pdf (texto o escaneado). Los archivos de .pdf insertados en texto son mejores, ya que no habrá errores en la extracción y ubicación de caracteres. - Para archivos .pdf y .tiff, se pueden procesar hasta 2000 páginas. - El tamaño del archivo debe ser inferior a 50 MB. - Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10 000 x 10 000 píxeles. - Para .pdf archivos, las dimensiones deben ser como máximo de 11 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y más pequeños. - El tamaño total de los datos de entrenamiento es de 500 páginas o menos. |
|
Entornos de Multi-Geo Al configurar Syntex en un entorno multigeográfico de Microsoft 365 , solo puede configurarlo para que use el tipo de modelo en la ubicación central. Si desea usar este tipo de modelo en una ubicación satélite, póngase en contacto con el soporte técnico de Microsoft. |
|
Bibliotecas multimodelo Si se aplican dos o más modelos entrenados a la misma biblioteca, el archivo se clasifica mediante el modelo que tiene la puntuación de confianza media más alta. Las entidades extraídas serán solo del modelo aplicado. |