Condividi tramite


Competenza Layout documento

Nota

Questa funzionalità è attualmente in anteprima pubblica. Questa anteprima viene messa a disposizione senza contratto di servizio e non è consigliata per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero presentare funzionalità limitate. Per altre informazioni, vedere le Condizioni supplementari per l'uso delle anteprime di Microsoft Azure.

La competenza Layout documento analizza un documento per estrarre aree di interesse e le relative relazioni per produrre una rappresentazione sintattica del documento in formato Markdown. Questa competenza usa il modello di layout di Document Intelligence fornito in Intelligence sui documenti di Intelligenza artificiale di Azure.

Questo articolo è la documentazione di riferimento per la competenza Layout documento. Per informazioni sull'utilizzo, vedere Suddivisione in blocchi e vettorizzazione in grado di conoscere la struttura.

La competenza Layout documento chiama l'anteprima pubblica di Document Intelligence versione 2024-07-31-preview. Attualmente è disponibile solo nelle aree di Azure seguenti:

  • Stati Uniti orientali
  • Stati Uniti occidentali 2
  • Europa occidentale
  • Stati Uniti centro-settentrionali

I formati di file supportati comprendono:

  • PDF.
  • .JPEG
  • .JPG
  • .PNG
  • .BMP
  • . DIVERBIO
  • DOCX
  • XLSX
  • .PPTX
  • HTML.

Nota

Questa competenza è associata ai servizi di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione delle competenze predefinite viene addebitata secondo gli attuali prezzi con pagamento in base al consumo dei Servizi di Azure AI.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Limiti dei dati

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
  • Anche se le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello Azure AI Document Intelligence a pagamento (S0) e 4 MB per il livello Gratuito di Intelligence per intelligenza artificiale di Azure (F0), l'indicizzazione è soggetta ai limiti dell'indicizzatore del livello di servizio di ricerca.
  • Le dimensioni dell'immagine devono essere comprese tra 50 pixel x 50 pixel o 10.000 pixel x 10.000 pixel.
  • Se i PDF sono bloccati da password, rimuovere il blocco prima di eseguire l'indicizzatore.

Lingue supportate

Per il testo stampato, vedere Il modello di layout di Document Intelligence per intelligenza artificiale di Azure supporta le lingue supportate.

Limiti

Durante l'anteprima pubblica, questa competenza presenta le restrizioni seguenti:

  • La competenza non può estrarre immagini incorporate all'interno dei documenti.
  • I numeri di pagina non sono inclusi nell'output generato.
  • La competenza non è adatta per documenti di grandi dimensioni che richiedono più di 5 minuti di elaborazione nel modello di layout di Intelligenza artificiale di Intelligence sui documenti. La competenza si verifica in timeout, ma gli addebiti si applicano comunque alla risorsa multiservizio dei servizi di intelligenza artificiale se è collegata al set di competenze a scopo di fatturazione. Assicurarsi che i documenti siano ottimizzati per rimanere entro i limiti di elaborazione per evitare costi non necessari.

Parametri della competenza

I parametri fanno distinzione tra maiuscole e minuscole.

Nome parametro Valori consentiti Descrizione
outputMode oneToMany Controlla la cardinalità dell'output prodotto dalla competenza.
markdownHeaderDepth h1, h2, h3, h4, h5h6(default) Questo parametro descrive il livello di annidamento più profondo da considerare. Ad esempio, se markdownHeaderDepth è indicato come "h3" qualsiasi sezione markdown più profonda di h3 (ovvero #### e più approfondita) viene considerata come "contenuto" che deve essere aggiunta a qualsiasi livello del relativo elemento padre.

Input competenze

Nome input Descrizione
file_data File da cui estrarre il contenuto.

L'input "file_data" deve essere un oggetto definito come:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

In alternativa, può essere definita come:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

L'oggetto riferimento file può essere generato in uno dei modi seguenti:

  • Impostazione del parametro nella definizione dell'indicizzatore allowSkillsetToReadFileData su true. Questa impostazione crea un percorso /document/file_data che rappresenta i dati del file originale scaricati dall'origine dati BLOB. Questo parametro si applica solo ai file nell'archivio BLOB di Azure.

  • Avere una competenza personalizzata che restituisce un oggetto JSON definito che fornisce $type, datao url e sastoken. Il $type parametro deve essere impostato su filee data deve essere la matrice di byte con codifica base 64 del contenuto del file. Il url parametro deve essere un URL valido con accesso per il download del file in tale percorso.

Output competenze

Nome output Descrizione
markdown_document Insieme di oggetti "sections", che rappresentano ogni singola sezione del documento Markdown.

Definizione di esempio

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Output di esempio

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

Il valore di markdownHeaderDepth controlla il numero di chiavi nel dizionario "sections". Nella definizione della competenza di esempio, poiché markdownHeaderDepth è "h3", nel dizionario "sections" sono presenti tre chiavi: h1, h2, h3.

Vedi anche