Inteligencia documental compuesta por modelos personalizados

Artículo
12/12/2024

Este contenido se aplica a: v4.0 (GA) | Versiones anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)

::: moniker-end

Este contenido se aplica a: v3.1 (GA) | Última versión: v4.0 (GA) | Versiones anteriores: v3.0 v2.1

Este contenido se aplica a: v3.0 (GA) | Últimas versiones: v4.0 (GA) v3.1 | Versión anterior: v2.1

Este contenido se aplica a: v2.1 | Última versión: v4.0 (GA)

Importante

La operación model compose v4.0 2024-11-30 (GA) agrega un clasificador entrenado explícitamente en lugar de un clasificador implícito para el análisis. Para la versión anterior del modelo compuesto, consulte Modelos personalizados compuestos v3.1. Si actualmente usa modelos compuestos, considere la posibilidad de actualizar a la implementación más reciente.

¿Qué es un modelo compuesto?

Con los modelos compuestos, puede agrupar varios modelos personalizados en un modelo compuesto llamado con un único identificador de modelo. Por ejemplo, el modelo compuesto puede incluir modelos personalizados entrenados para analizar sus pedidos de compra de suministros, equipos y mobiliario. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.

Algunos escenarios requieren clasificar primero el documento y, a continuación, analizarlo con el modelo más adecuado para extraer los campos del modelo. Estos escenarios pueden incluir aquellos en los que un usuario carga un documento, pero el tipo de documento no se conoce explícitamente. Otro escenario puede ser cuando se examinan varios documentos conjuntamente en un solo archivo y este se envía para su procesamiento. A continuación, la aplicación debe identificar los documentos de componentes y seleccionar el mejor modelo para cada documento.

En versiones anteriores, la operación model compose realizó una clasificación implícita para decidir qué modelo personalizado representa mejor el documento enviado. La implementación 2024-11-30 (GA) de la operación model compose reemplaza la clasificación implícita de las versiones anteriores por un paso de clasificación explícita y agrega enrutamiento condicional.

Ventajas de la nueva operación de redacción del modelo

La nueva operación model compose requiere que entrene un clasificador explícito y proporciona varias ventajas.

Mejora incremental continua. Puede mejorar de forma coherente la calidad del clasificador mediante la adición de más ejemplos y la mejora incremental de la clasificación. Este ajuste preciso garantiza que los documentos se enruten siempre al modelo adecuado para la extracción.
Control completo sobre el enrutamiento. Al agregar un enrutamiento basado en confianza, se proporciona un umbral de confianza para el tipo de documento y la respuesta de clasificación.
Omisión de tipos de documentos específicos del documento durante la operación. Las implementaciones anteriores de la operación model compose seleccionaron el mejor modelo de análisis para la extracción en función de la puntuación de confianza, incluso si las puntuaciones de confianza más altas eran relativamente bajas. Al proporcionar un umbral de confianza o no asignar explícitamente un tipo de documento conocido desde la clasificación a un modelo de extracción, puede omitir tipos de documentos específicos.
Análisis de varias instancias del mismo tipo de documento. Cuando se empareja con la opción splitMode del clasificador, la operación model compose puede detectar varias instancias del mismo documento en un archivo y dividir el archivo para procesar cada documento de forma independiente. El uso de splitMode permite el procesamiento de varias instancias de un documento en una sola solicitud.
Compatibilidad con las características del complemento. Características del complemento tales como campos de consulta o códigos de barras también se pueden especificar como parte de los parámetros del modelo de análisis.
Máximo de modelos personalizados asignados expandido a 500. La nueva implementación de la operación model compose permite asignar hasta 500 modelos personalizados entrenados a un solo modelo compuesto.

Cómo usar la composición de modelos

Empiece por recopilar ejemplos de todos los documentos necesarios, incluidos ejemplos con información que se debe extraer u omitir.
Entrene un clasificador mediante la organización de los documentos en carpetas donde los nombres de carpeta son el tipo de documento que tiene previsto usar en la definición del modelo compuesto.
Por último, entrene un modelo de extracción para cada uno de los tipos de documento que tenga previsto usar.
Una vez entrenados los modelos de clasificación y extracción, use Document Intelligence Studio, bibliotecas cliente o la API REST para componer los modelos de clasificación y extracción en un modelo compuesto.

Use el parámetro splitMode para controlar el comportamiento de división de archivos:

Ninguno. Todo el archivo se trata como un solo documento.
perPage. Cada página del archivo se trata como un documento independiente.
auto. El archivo se divide automáticamente en documentos.

Precios y facturación

Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas por el modelo de análisis de bajada. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Con la adición de la clasificación explícita, se generan cargos por la clasificación de todas las páginas en el archivo de entrada. Para más información, consulte la página de precios de Documento de inteligencia.

Uso de la operación de redacción del modelo

Empiece por crear una lista de todos los identificadores de modelo que desea redactar en un solo modelo.
Redacte los modelos en un identificador de modelo único mediante las bibliotecas cliente, API REST o Studio.
Use el identificador de modelo compuesto para analizar documentos.

Facturación

Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Para más información, consulte la página de precios de Documento de inteligencia.

No hay cambios en los precios por analizar un documento usando un modelo personalizado individual o un modelo personalizado compuesto.

Características de modelos compuestos

Los modelos Custom template y custom neural pueden componer un único modelo compuesto en varias versiones de API.
La respuesta incluye una propiedad docType para indicar cuál de los modelos compuestos se usó a fin de analizar el documento.
En el caso de los modelos custom template, el modelo compuesto se puede crear mediante variaciones de una plantilla personalizada o distintos tipos de formulario. Esta operación resulta útil cuando los formularios de entrada pertenecen a una de varias plantillas.
En el caso de los modelos custom neural, el procedimiento recomendado es agregar todas las diferentes variaciones de un único tipo de documento en un único conjunto de datos de entrenamiento y entrenar con un modelo neuronal personalizado. La operación model compose es más adecuada para escenarios en los que se envían documentos de diferentes tipos para su análisis.

Límites del modelo compuesto

Con la operación model compose, puede asignar hasta 500 modelos a un identificador de modelo único. Si el número de modelos que quiero componer supera el límite superior de un modelo compuesto, puede usar una de estas alternativas:
- Clasifique los documentos antes de llamar al modelo personalizado. Puede usar el Modelo de lectura y compilar una clasificación basada en el texto extraído de los documentos y determinadas frases mediante orígenes como código, expresiones regulares o búsqueda.
- Si desea extraer los mismos campos de varios documentos estructurados, semiestructurados y no estructurados, considere la posibilidad de usar el aprendizaje profundo modelo neuronal personalizado. Obtenga más información sobre las diferencias de entre el modelo de plantilla personalizada y el modelo neuronal personalizado.
El análisis de un documento mediante modelos compuestos es idéntico al análisis de un documento mediante un único modelo. El Analyze Documentresultado devuelve una docType propiedad que indica cuál de los modelos de componentes ha seleccionado para analizar el documento.
Actualmente, la operación model compose solo está disponible para los modelos personalizados entrenados con etiquetas.

Compatibilidad con el modelo compuesto

Tipo de modelo personalizado	Modelos entrenados con v2.1 y v2.0	Modelos neuronales y de plantilla personalizados v3.1 y v3.0	Modelos neuronales y de plantilla personalizados v4.0 2024-11-30 (GA)
Modelos entrenados con la versión 2.1 y v2.0	No compatible	No compatible	No compatible
Modelos neuronales y de plantilla personalizados v3.0 y v3.1	No compatible	Compatible	Compatible
Modelos neuronales y de plantilla personalizados v4.0	No compatible	Compatible	Compatible

Para crear un modelo entrenado con una versión anterior de la API (v2.1 o anterior), entrene un modelo con la API v3.0 usando el mismo conjunto de datos etiquetado. Esa incorporación garantiza que el modelo v2.1 se pueda componer con otros modelos.
Con los modelos compuestos mediante la versión 2.1 de la API sigue siendo compatible, sin necesidad de actualizaciones.

Opciones de desarrollo

Documento de inteligencia v4.0:2024-11-30 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo personalizado	• Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python
Modelo compuesto	• Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python

Documento de inteligencia v3.1:2023-07-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo personalizado	• Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python
Modelo compuesto	• Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python

Documento de inteligencia v3.0:2022-08-31 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Característica	Recursos
Modelo personalizado	• Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python
Modelo compuesto	• Estudio de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python

Document Intelligence v2.1 admite los siguientes recursos:

Característica	Recursos
Modelo personalizado	● Herramienta de etiquetado de Documento de inteligencia ● API de REST ● SDK de biblioteca cliente ● Contenedor Docker de Documento de inteligencia
Modelo compuesto	• Herramienta de etiquetado de Documento de inteligencia • API de REST • SDK de C# • SDK de Java • SDK de JavaScript • SDK de Python

Pasos siguientes

Aprenda a crear y componer modelos personalizados:

Creación de un modelo personalizadoCompose custom models

Compartir vía