Modèles personnalisés composés Intelligence documentaire
Ce contenu s’applique à : v4.0 (GA) | Versions précédentes : v3.1 (GA) v3.0 (GA) v2.1 (GA)
::: moniker-end
Ce contenu s’applique à : v3.1 (GA) | Dernière version : v4.0 (GA) | Versions précédentes : v3.0 v2.1
Ce contenu s’applique à : v3.0 (GA) | Dernières versions : v4.0 (GA) v3.1 | Version précédente : v2.1
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (GA)
Important
L’opération model compose
v4.0 2024-11-30 (GA) ajoute un classifieur formé explicitement au lieu d’un classifieur implicite pour l’analyse. Pour la version précédente du modèle composé, consultez Modèles personnalisés composés v3.1. Si vous utilisez actuellement des modèles composés, envisagez d’effectuer une mise à niveau vers la dernière implémentation.
Qu’est-ce qu’un modèle composé ?
Avec les modèles composés, vous pouvez regrouper plusieurs modèles personnalisés dans un modèle composé qui est appelé avec un ID de modèle unique. Par exemple, votre modèle composé peut inclure des modèles personnalisés qui sont entraînés pour analyser vos approvisionnements, vos équipements et vos bons de commande de mobilier. Au lieu d’essayer de sélectionner manuellement le modèle approprié, vous pouvez utiliser un modèle composé pour déterminer le modèle personnalisé approprié pour chaque analyse et extraction.
Pour certains scénarios, il est d’abord nécessaire de classer le document, puis de l’analyser avec le modèle le mieux adapté pour extraire les champs du modèle. Cela peut inclure les scénarios dans lesquels un utilisateur charge un document, mais où le type de document n’est pas explicitement connu. Cela peut également s’appliquer lorsque plusieurs documents sont analysés ensemble dans un seul fichier et que ce dernier est envoyé pour traitement. Votre application doit ensuite identifier les documents de composant et sélectionner le meilleur modèle pour chaque document.
Dans les versions précédentes, l’opération model compose
a effectué une classification implicite pour déterminer le modèle personnalisé qui représente le mieux le document envoyé. L’implémentation 2024-11-30 (GA) de l’opération model compose
remplace la classification implicite des versions antérieures par une étape de classification explicite et ajoute le routage conditionnel.
Avantages de la nouvelle opération de composition de modèles
La nouvelle opération model compose
vous oblige à entraîner un classifieur explicite et offre plusieurs avantages.
Amélioration incrémentielle continue. Vous pouvez améliorer de façon cohérente la qualité du classifieur en ajoutant d’autres échantillons et en améliorant de façon incrémentielle la classification. Ce réglage précis garantit que vos documents sont toujours acheminés vers le modèle approprié pour l’extraction.
Contrôle complet du routage. En ajoutant un routage basé sur la confiance, vous fournissez un seuil de confiance pour le type de document et la réponse de classification.
Ignorez les types de documents spécifiques au document au cours de l’opération. Les implémentations antérieures de l’opération
model compose
ont sélectionné le meilleur modèle d’analyse pour l’extraction en fonction du score de confiance même si les scores de confiance les plus élevés étaient relativement faibles. En fournissant un seuil de confiance ou en ne mappant pas explicitement un type de document connu de la classification à un modèle d’extraction, vous pouvez ignorer des types de documents spécifiques.Analysez plusieurs instances du même type de document. Lorsqu’elle est associée à l’option
splitMode
du classifieur, l’opérationmodel compose
peut détecter plusieurs instances du même document dans un fichier et fractionner ce dernier pour traiter chaque document indépendamment. UtilisersplitMode
permet de traiter plusieurs instances d’un document dans une seule requête.Prise en charge des fonctionnalités complémentaires. Vous pouvez également spécifier des fonctionnalités complémentaires, telles que les champs de requête ou les codes à barres, comme paramètres du modèle d’analyse.
Augmentation du maximum de modèles personnalisés affectés pour 500. La nouvelle implémentation de l’opération
model compose
vous permet d’affecter jusqu’à 500 modèles personnalisés formés à un modèle composé unique.
Comment utiliser la composition de modèle
Commencez par collecter des échantillons de tous les documents nécessaires, y compris des échantillons contenant des informations qui doivent être extraites ou ignorées.
Entraînez un classifieur en organisant les documents dans les dossiers dont les noms correspondent au type de document que vous envisagez d’utiliser dans la définition de votre modèle composé.
Enfin, entraînez un modèle d’extraction pour chacun des types de document que vous envisagez d’utiliser.
Une fois vos modèles de classification et d’extraction entraînés, utilisez Document Intelligence Studio, les bibliothèques clientes ou l’API REST pour composer les modèles de classification et d’extraction dans un modèle composé.
Utilisez le paramètre splitMode
pour contrôler le comportement de fractionnement de fichier :
- Aucun. Le fichier entier est traité comme un document unique.
- perPage. Chaque page du fichier est traitée comme un document distinct.
- auto. Le fichier est automatiquement divisé en documents.
Facturation et tarification
Les modèles composés sont facturés de la même façon que les modèles personnalisés individuels. La tarification dépend nombre de pages analysées par le modèle d’analyse en aval. La facturation dépend du prix de l’extraction des pages acheminées vers un modèle d’extraction. Outre la classification explicite, des frais de classification de toutes les pages du fichier d’entrée s’ajoutent. Pour plus d’informations, consultez la page Tarification d’Intelligence documentaire.
Utiliser l’opération de composition de modèle
Commencez par créer une liste de tous les ID de modèle que vous souhaitez composer dans un seul modèle.
Composez les modèles dans un seul ID de modèle à l’aide de Studio, de l’API REST ou des bibliothèques clientes.
Utilisez l’ID de modèle composé pour analyser les documents.
Billing
Les modèles composés sont facturés de la même façon que les modèles personnalisés individuels. La tarification dépend du nombre de pages analysées. La facturation dépend du prix de l’extraction des pages acheminées vers un modèle d’extraction. Pour plus d’informations, consultez la page Tarification d’Intelligence documentaire.
- Les tarifs ne changent pas pour l’analyse d’un document à l’aide d’un modèle personnalisé ou d’un modèle personnalisé composé.
Fonctionnalités des modèles composés
Les modèles
Custom template
etcustom neural
peuvent être composés ensemble dans un seul modèle composé entre plusieurs versions d’API.La réponse inclut une propriété
docType
pour indiquer les modèles composés utilisés pour analyser le document.Pour les modèles
custom template
, le modèle composé peut être créé à l’aide de variantes d’un modèle personnalisé ou de différents types de formulaires. Cette opération est utile lorsque les formulaires entrants appartiennent à l’un de plusieurs modèles.Pour les modèles
custom neural
, il est recommandé d’ajouter toutes les variantes d’un type de document dans un jeu de données d’entraînement et d’effectuer l’entraînement sur un modèle neuronal personnalisé. L’opérationmodel compose
convient plus particulièrement aux scénarios impliquant des documents de différents types qui sont envoyés à des fins d’analyse.
Limites du modèle composé
L’opération
model compose
permet d’affecter jusqu’à 500 modèles à un seul ID de modèle. Si le nombre de modèles que vous souhaitez composer dépasse la limite supérieure d’un modèle composé, vous pouvez utiliser l’une des alternatives suivantes :Classifiez les documents avant d’appeler le modèle personnalisé. Vous pouvez utiliser le modèle de lecture et créer une classification basée sur le texte extrait des documents et certaines expressions à l’aide de code, d’expressions régulières ou d’une recherche.
Si vous souhaitez extraire les mêmes champs de différents documents structurés, semi-structurés et non structurés, envisagez d’utiliser le modèle neuronal personnalisé de Deep Learning. En savoir plus sur les différences entre le modèle personnalisé et le modèle neuronal personnalisé.
L’analyse d’un document à l’aide de modèles composés est identique à l’analyse d’un document à l’aide d’un modèle unique. Le résultat
Analyze Document
retourne une propriétédocType
qui indique les modèles de composants que vous avez sélectionnés pour l’analyse du document.Actuellement, l’opération
model compose
n’est disponible que pour les modèles personnalisés entraînés avec des étiquettes.
Compatibilité du modèle composé
Type de modèle personnalisé | Modèles formés avec la v2.1 et la v2.0 | Modèles personnalisés et neuronaux personnalisés v3.1 et v3.0 | Modèle personnalisé et modèles neuronaux v4.0 2024-11-30 (GA) |
---|---|---|---|
Modèles entraînés avec les versions 2.1 et 2.0 | Non pris en charge | Non pris en charge | Non pris en charge |
Modèles personnalisés et neuronaux v3.0 et v3.1 | Non pris en charge | Prise en charge | Pris en charge |
Modèle personnalisé et modèles neuronaux v4.0 | Non pris en charge | Prise en charge | Prise en charge |
Pour composer un modèle entraîné avec une version antérieure de l'API (v2.1 ou antérieure), entraînez un modèle avec l’API v3.0 en utilisant le même jeu de données étiqueté. Cet ajout garantit que vous pouvez composer le modèle v2.1 avec d’autres modèles.
Avec les modèles composés, l’utilisation de la version 2.1 de l’API continue d’être prise en charge sans mise à jour nécessaire.
Options de développement
Intelligence documentaire v4.0:2024-11-30 (GA) prend en charge les outils, applications et bibliothèques suivants :
Fonctionnalité | Ressources |
---|---|
Modèle personnalisé | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modèle composé | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.1 :2023-07-31 (GA) prend en charge les outils, applications et bibliothèques suivants :
Fonction | Ressources |
---|---|
Modèle personnalisé | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modèle composé | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.0 :31-08-2022 (GA) prend en charge les outils, applications et bibliothèques suivants :
Fonction | Ressources |
---|---|
Modèle personnalisé | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modèle composé | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Intelligence documentaire v2.1 prend en charge les ressources suivantes :
Fonction | Ressources |
---|---|
Modèle personnalisé | ● Outil d’étiquetage Intelligence Documentaire • API REST • SDK Bibliothèque client • Intelligence Documentaire Conteneur Docker |
Modèle composé | • Outil d’étiquetage Document Intelligence • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Étapes suivantes
Apprenez à créer et à composer des modèles personnalisés :