Compétence Mise en page du document

Article
02/13/2025

Remarque

Cette fonctionnalité est actuellement disponible en préversion publique. Cette préversion est fournie sans contrat de niveau de service et n’est pas recommandée pour les charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

La compétence Disposition du document analyse un document pour extraire des régions d’intérêt et leurs relations entre elles pour produire une représentation syntactique du document au format Markdown. Cette compétence utilise le modèle de disposition Document Intelligence fourni dans Azure AI Document Intelligence.

Cet article est la documentation de référence pour la compétence Disposition du document. Pour plus d’informations sur l’utilisation, consultez Segmentation et vectorisation prenant en charge la structure.

La compétence Disposition du document appelle la préversion publique Document Intelligence version 2024-07-31-preview. Il est actuellement disponible uniquement dans les régions Azure suivantes :

USA Est
USA Ouest 2
Europe Ouest
Centre-Nord des États-Unis

Les formats de fichiers pris en charge sont les suivants :

PDF.
.JPEG
.JPG
.PNG
.BMP
.TIFF
.DOCX
.XLSX
.PPTX
.HTML

Remarque

Cette compétence est liée aux services Azure AI et nécessite une ressource facturable pour les transactions qui dépassent 20 documents par indexeur et par jour. L'exécution des compétences intégrées est facturée au prix actuel du paiement à l'utilisation des services Azure AI.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Limites de données

Pour les PDF et TIFF, jusqu'à 2 000 pages peuvent être traitées (avec un abonnement gratuit, seules les deux premières pages sont traitées).
Même si la taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau Azure AI Document Intelligence payant (S0) et de 4 Mo pour le niveau Gratuit Azure AI Document Intelligence (F0), l’indexation est soumise aux limites d’indexeur de votre niveau de service de recherche.
Les dimensions de l’image doivent être comprises entre 50 pixels x 50 pixels ou 10 000 pixels x 10 000 pixels.
Si vos fichiers PDF sont verrouillés par mot de passe, supprimez le verrou avant d’exécuter l’indexeur.

Langues prises en charge

Reportez-vous au modèle de disposition Azure AI Document Intelligence pris en charge les langues pour le texte imprimé.

Limites

Pendant la préversion publique, cette compétence a les restrictions suivantes :

La compétence ne peut pas extraire d’images incorporées dans des documents.
Les numéros de page ne sont pas inclus dans la sortie générée.
La compétence n’est pas adaptée aux documents volumineux nécessitant plus de 5 minutes de traitement dans le modèle de disposition AI Document Intelligence. La compétence expire, mais les frais s’appliquent toujours à la ressource multiservices AI Services s’il est attaché à l’ensemble de compétences à des fins de facturation. Assurez-vous que les documents sont optimisés pour rester dans les limites de traitement pour éviter les coûts inutiles.

Paramètres de la compétence

Les paramètres respectent la casse.

Nom du paramètre	Valeurs autorisées	Description
`outputMode`	`oneToMany`	Contrôle la cardinalité de la sortie produite par la compétence.
`markdownHeaderDepth`	`h1`, , `h2`, `h4h3`, , `h5h6(default)`	Ce paramètre décrit le niveau d’imbrication le plus profond qui doit être pris en compte. Par exemple, si markdownHeaderDepth est indiqué comme « h3 » toute section markdown plus profonde que h3 (autrement dit, #### et plus) est considérée comme « contenu » qui doit être ajouté à n’importe quel niveau auquel son parent est associé.

Entrées de la compétence

Nom de l'entrée	Description
`file_data`	Fichier à partir duquel le contenu doit être extrait.

L’entrée « file_data » doit être un objet défini comme suit :

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Elle peut également être définie comme suit :

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

L’objet de référence de fichier peut être généré de l’une des manières suivantes :

Définition du paramètre sur la allowSkillsetToReadFileData valeur true de votre définition d’indexeur. Ce paramètre crée un chemin d’accès /document/file_data qui représente les données de fichier d’origine téléchargées à partir de votre source de données d’objet blob. Ce paramètre s’applique uniquement aux fichiers du stockage Blob Azure.
Avoir une compétence personnalisée retournant un objet JSON défini qui fournit $type, dataou url et sastoken. Le $type paramètre doit être défini filesur , et data doit être le tableau d’octets codé en base 64 du contenu du fichier. Le url paramètre doit être une URL valide avec accès pour télécharger le fichier à cet emplacement.

Sorties de la compétence

Nom de sortie	Description
`markdown_document`	Collection d’objets « sections », qui représentent chaque section individuelle dans le document Markdown.

Exemple de définition

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Exemple de sortie

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

La valeur du markdownHeaderDepth contrôle le nombre de clés dans le dictionnaire « sections ». Dans l’exemple de définition de compétence, étant donné que « markdownHeaderDepth h3 », il existe trois clés dans le dictionnaire « sections » : h1, h2, h3.

Partager via