Introducción a los tipos de modelo en Microsoft Syntex
Se aplica a: ✓ Todos los modelos personalizados | ✓ Todos los modelos precompilados
La comprensión del contenido en Microsoft Syntex comienza con los modelos de procesamiento de documentos. Los modelos de procesamiento de documentos le permiten identificar y clasificar documentos que se cargan en bibliotecas de documentos de SharePoint y, a continuación, extraer la información que necesita de cada archivo.
Cuando se aplica a una biblioteca de documentos de SharePoint, el modelo está asociado a un tipo de contenido y tiene columnas para almacenar la información que se va a extraer. El tipo de contenido que cree se almacena en la galería de tipo de contenido de SharePoint. También puede optar por usar tipos de contenido existentes para usar su esquema.
Syntex usa modelos personalizados y modelos precompilados.
Los modelos pueden ser modelos empresariales, que se crean en un centro de contenido o modelos locales, que se crean en el sitio de SharePoint local.
Modelos personalizados
El tipo de modelo personalizado que elija dependerá de los tipos de archivos que use, el formato y la estructura de los archivos y de dónde quiera aplicar el modelo.
Los modelos personalizados incluyen:
- Procesamiento de documentos no estructurados
- Procesamiento de documentos de forma libre
- Procesamiento estructurado de documentos
Para ver las diferencias en paralelo en los modelos personalizados, consulte Comparación de modelos personalizados.
Procesamiento de documentos no estructurados
Use el modelo de procesamiento de documentos no estructurado para clasificar automáticamente documentos y extraer información de ellos. Funciona mejor con documentos sin estructura, como cartas o contratos. Estos documentos deben tener texto que pueda identificarse en función de frases o patrones. El texto identificado designa tanto el tipo de archivo (su clasificación) como lo que le gustaría extraer (sus extractores).
Por ejemplo, un documento no estructurado podría ser una carta de renovación de contrato que pueda escribirse de varias maneras. Sin embargo, la información existe de forma coherente en el cuerpo de cada documento de renovación del contrato, como la cadena de texto "Fecha de inicio del servicio de" seguida de una fecha real.
Este tipo de modelo admite la gama más amplia de tipos de archivo y admite más de 40 idiomas.
Al crear un modelo de procesamiento de documentos no estructurado, use la opción Modelo de clase única .
Para obtener más información, vea Información general sobre el procesamiento de documentos no estructurados.
Procesamiento de documentos de forma libre
Use el modelo de procesamiento de documentos de forma libre para extraer automáticamente información de documentos no estructurados y de forma libre, como cartas y contratos, donde la información puede aparecer en cualquier parte del documento.
Los modelos de procesamiento de documentos de forma libre usan Microsoft Power Apps AI Builder para crear y entrenar modelos en Syntex.
Nota:
El modelo de procesamiento de documentos de forma libre todavía no está disponible en algunas regiones. Para obtener más información, consulte Disponibilidad de características por región.
Dado que su organización recibe cartas y documentos en grandes cantidades de diversos orígenes, como correo, fax y correo electrónico, procesar estos documentos y escribirlos manualmente en una base de datos puede tardar mucho tiempo. Mediante el uso de la inteligencia artificial para extraer el texto y otra información de estos documentos, este modelo automatiza este proceso.
Este tipo de modelo es la mejor opción para documentos en archivos PDF o de imagen cuando no se requiere la clasificación automática del tipo de documento y admite más de 40 idiomas.
Al crear un modelo de procesamiento de documentos de forma libre, use la opción Modelo de extracción de forma libre .
Para obtener más información, consulte Información general sobre el procesamiento de documentos estructurados y de forma libre.
Procesamiento estructurado de documentos
Use el modelo de procesamiento estructurado de documentos para identificar automáticamente los valores de campo y tabla. Funciona mejor para documentos estructurados o semiestructurados, como formularios y facturas.
Los modelos de procesamiento estructurado de documentos usan el procesamiento de documentos de Microsoft Power Apps AI Builder (anteriormente conocido como procesamiento de formularios) para crear y entrenar modelos en Syntex.
Este tipo de modelo admite la gama más amplia de idiomas y se entrena para comprender el diseño del formulario a partir de documentos de ejemplo y, a continuación, aprende a buscar los datos que necesita extraer de ubicaciones similares. Forms suelen tener un diseño más estructurado donde las entidades están en la misma ubicación (por ejemplo, un número de seguridad social en un formulario fiscal).
Al crear un modelo de procesamiento de documentos estructurados, use la opción Modelo de extracción estructurada .
Para obtener más información, consulte Información general sobre el procesamiento de documentos estructurados y de forma libre.
Modelos creados previamente
Si no necesita crear un modelo personalizado, puede usar un modelo de procesamiento de documentos precompilado que ya se haya entrenado para documentos estructurados específicos.
Los modelos precompilados incluyen:
- Procesamiento del contrato
- Procesamiento de facturas
- Procesamiento de recibos
- Procesamiento de información confidencial
- Procesamiento simple de documentos
Los modelos precompilados se entrenan previamente para reconocer los documentos y la información estructurada de los documentos. En lugar de tener que crear un nuevo modelo personalizado desde cero, puede iterar en un modelo previamente entrenado existente para agregar campos específicos que se ajusten a las necesidades de su organización.
Procesamiento del contrato
El modelo de procesamiento de contrato precompilado analiza y extrae información clave de documentos de contrato. La API analiza los contratos en varios formatos y extrae información clave del contrato, como el nombre del cliente o entidad, la dirección de facturación, la jurisdicción y la fecha de expiración.
Para obtener más información sobre los modelos de procesamiento de contratos, consulte Uso de un modelo precompilado para extraer información de contratos.
Procesamiento de facturas
El modelo de procesamiento de facturas precompilado analiza y extrae información clave de las facturas de ventas. La API analiza las facturas en varios formatos y extrae la información clave de la factura, como el nombre del cliente, la dirección de facturación, la fecha de vencimiento y el importe vencido.
Para obtener más información sobre los modelos de procesamiento de facturas, consulte Uso de un modelo precompilado para extraer información de facturas.
Procesamiento de recibos
El modelo de procesamiento de recibos precompilado analiza y extrae información clave de los recibos de ventas. La API analiza los recibos impresos y manuscritos y extrae información de recibo de clave, como el nombre del comerciante, el número de teléfono del comerciante, la fecha de transacción, los impuestos y el total de la transacción.
Para obtener más información sobre los modelos de procesamiento de recibos, consulte Uso de un modelo precompilado para extraer información de recibos.
Procesamiento de información confidencial
El modelo de procesamiento de información confidencial precompilado analiza, detecta y extrae información clave de documentos. La API analiza los contratos en varios formatos y extrae información confidencial clave, como números de seguridad social, números de cuentas financieras, números de identificación de licencia de conducir y otra información personal.
Para obtener más información sobre los modelos de procesamiento de información confidencial, consulte Uso de un modelo precompilado para detectar información confidencial de documentos.
Procesamiento simple de documentos
El modelo de procesamiento de documentos simple precompilado ofrece una solución flexible y preentrenada para extraer pares clave-valor, marcas de selección y entidades con nombre de documentos estructurados básicos. A diferencia de otros modelos precompilados con esquemas fijos, este modelo puede identificar claves que otros pueden perder, lo que proporciona una alternativa valiosa al etiquetado y el entrenamiento de modelos personalizados. Este modelo también admite códigos de barras y detección de idioma.
Para obtener más información sobre los modelos de procesamiento de documentos simples, consulte Uso de un modelo precompilado para detectar información confidencial de documentos.