Utiliser les modèles Document général, Lecture et Disposition
Si vous voulez extraire du texte, des langues et d’autres informations de documents ayant des structures non prévisibles, vous pouvez utiliser les modèles Lecture, Document général ou Disposition.
Dans votre société réalisant des sondages, les clients et les partenaires envoient souvent des spécifications, des offres, des cahiers des charges et d’autres documents avec des structures non prévisibles. Vous voulez savoir si Azure AI Intelligence documentaire peut analyser et extraire des valeurs de ces documents.
Vous allez découvrir ici les modèles prédéfinis que Microsoft fournit pour les documents généraux.
Utilisation du modèle Lecture
Le modèle de lecture d’Azure AI Intelligence documentaire extrait du texte imprimé et manuscrit à partir de documents et d’images. Il est utilisé pour permettre l’extraction de texte dans tous les autres modèles prédéfinis.
Le modèle de lecture peut aussi détecter la langue dans laquelle une ligne de texte est écrite, et reconnaître si elle est manuscrite ou en texte imprimé.
Remarque
Le modèle de lecture prend en charge plus de langues pour le texte imprimé que pour le texte manuscrit. Consultez la documentation pour voir la liste actuelle des langues prises en charge.
Pour les fichiers PDF ou TIFF de plusieurs pages, vous pouvez utiliser le paramètre pages
dans votre demande pour spécifier une plage de pages à analyser.
Le modèle Lecture est idéal si vous voulez extraire des mots et des lignes de documents sans structure fixe ou prévisible.
Utilisation du modèle Document général
Le modèle Document général étend les fonctionnalités du modèle Lecture en ajoutant la détection de paires clé-valeur, d’entités, de marques de sélection et de tableaux. Le modèle peut extraire ces valeurs de documents structurés, semi-structurés et non structurés.
Le modèle Document général est le seul modèle prédéfini prenant en charge l’extraction d’entités. Il peut reconnaître des entités comme les personnes, les organisations et les dates, et il travaille sur l’ensemble du document, et pas seulement sur les paires clé-valeur. Cette approche garantit que, quand la complexité structurelle a empêché le modèle d’extraire une paire clé-valeur, une entité peut être extraite à la place. Rappelez-vous cependant que parfois, une même partie du texte peut retourner à la fois une paire clé-valeur et une entité.
Les types d’entités que vous pouvez détecter sont les suivants :
Person
. Le nom d’une personne.PersonType
. Un poste ou un rôle.Location
. Des bâtiments, des caractéristiques géographiques, des entités géopolitiques.Organization
. Des entreprises, des organismes gouvernementaux, des clubs sportifs, des groupes musicaux et d’autres groupes.Event
. Des rencontres sociales, des événements historiques, des anniversaires.Product
. Des objets achetés et vendus.Skill
. Une capacité appartenant à une personne.Address
. L’adresse postale d’un emplacement physique.Phone number
. Les préfixes et les numéros pour les téléphones mobiles et les lignes fixes.Email
. Adresses e-mail.URL
. Les adresses de page web.IP Address
. Les adresses réseau pour le matériel informatique.DateTime
. Les dates du calendrier et les heures de la journée.Quantity
. Les mesures numériques avec leurs unités.
Utilisation du modèle Disposition
En plus de l’extraction de texte, le modèle de disposition retourne les marques de sélection et les tableaux du fichier image ou PDF en entrée. C’est un bon modèle à utiliser quand vous avez besoin d’informations détaillées sur la structure d’un document.
Quand vous numérisez un document, ce peut être fait selon un angle inadapté. Les tableaux peuvent avoir des structures compliquées, avec ou sans en-têtes, des cellules qui s’étendent sur des colonnes ou des lignes, et que des colonnes ou des lignes incomplètes. Le modèle Disposition peut traiter toutes ces difficultés pour extraire la structure complète du document.
Par exemple, chaque cellule de tableau est extraite avec :
- Le texte qu’elle contient.
- La taille et la position de son cadre de délimitation.
- Si elle fait partie d’une colonne d’en-tête.
- Des index pour indiquer sa position de ligne et de colonne dans la table.
Les marques de sélection sont extraites avec leur rectangle englobant, un indicateur de confiance, et si elles sont ou non sélectionnées.
En savoir plus
- Prise en charge linguistique d’Azure AI Intelligence documentaire
- Modèle de lecture Azure AI Intelligence documentaire
- Modèle de document général Azure AI Intelligence documentaire
- Modèle de disposition Azure AI Intelligence documentaire