Dovednost rozložení dokumentu

Článek
02/13/2025

Poznámka:

Tato funkce je v současné době ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučuje se pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Dovednost Rozložení dokumentu analyzuje dokument tak, aby extrahoval oblasti zájmu a jejich vzájemné vztahy a vytvořil syntaktické znázornění dokumentu ve formátu Markdownu. Tato dovednost používá model rozložení Document Intelligence poskytovaný v Azure AI Document Intelligence.

Tento článek je referenční dokumentací pro dovednosti rozložení dokumentu. Informace o použití najdete v tématu Vytváření bloků dat a vektorizace s podporou struktur.

Dovednost Rozložení dokumentu volá verzi Public Preview funkce Document Intelligence verze 2024-07-31-preview. V současné době je k dispozici pouze v následujících oblastech Azure:

USA – východ
USA – západ 2
Západní Evropa
Severní střed USA

Mezi podporované formáty souborů patří:

.PDF
. JPEG
.JPG
.PNG
.BMP
. HÁDKA
.DOCX
. XLSX
.PPTX
.HTML

Poznámka:

Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Omezení dat

U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
I když je velikost souboru pro analýzu dokumentů 500 MB pro placenou úroveň Azure AI Document Intelligence (S0) a 4 MB pro úroveň Azure AI Document Intelligence Free (F0), indexování podléhá omezením indexeru vaší úrovně vyhledávací služby.
Rozměry obrázku musí být mezi 50 pixely x 50 pixelů nebo 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, před spuštěním indexeru ho odeberte.

Podporované jazyky

Informace o tištěných textech najdete v podporovaných jazycích modelu rozložení Azure AI Document Intelligence.

Omezení

Ve verzi Public Preview má tato dovednost následující omezení:

Dovednost nemůže extrahovat obrázky vložené do dokumentů.
Čísla stránek nejsou zahrnuta do vygenerovaného výstupu.
Dovednost není vhodná pro velké dokumenty vyžadující více než 5 minut zpracování v modelu rozložení AI Document Intelligence. Dovednost vyprší, ale poplatky se budou dál vztahovat na prostředek s více službami AI, pokud je připojen k sadě dovedností pro účely fakturace. Ujistěte se, že jsou dokumenty optimalizované tak, aby zůstaly v mezích limitů zpracování, abyste se vyhnuli zbytečným nákladům.

Parametry dovedností

Parametry rozlišují malá a velká písmena.

Název parametru	Povolené hodnoty	Popis
`outputMode`	`oneToMany`	Řídí kardinalitu výstupu vytvořeného dovedností.
`markdownHeaderDepth`	`h1`, `h2`, `h3`, `h4`, , `h5h6(default)`	Tento parametr popisuje nejnižší úroveň vnoření, kterou byste měli zvážit. Pokud je například markdownHeaderDepth označený jako "h3" jakýkoli oddíl markdownu, který je hlubší než h3 (tj. #### a hlubší), považuje se za "obsah", který je potřeba přidat do jakékoli úrovně, na které je nadřazený objekt.

Vstupy dovedností

Název vstupu	Popis
`file_data`	Soubor, ze kterého se má obsah extrahovat.

Vstup "file_data" musí být objekt definovaný takto:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Alternativně se dá definovat takto:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

Objekt odkazu na soubor lze vygenerovat jedním z následujících způsobů:

Nastavení parametru v definici indexeru allowSkillsetToReadFileData na hodnotu true. Toto nastavení vytvoří cestu /document/file_data , která představuje původní data souboru stažená ze zdroje dat objektu blob. Tento parametr platí jenom pro soubory ve službě Azure Blob Storage.
Mít vlastní dovednosti vracející objekt JSON definovaný, který poskytuje $type, datanebo url a sastoken. Parametr $type musí být nastaven na filehodnotu a data musí být základním polem 64 bajtů obsahu souboru. Parametr url musí být platnou adresou URL s přístupem ke stažení souboru v daném umístění.

Výstupy dovedností

Název výstupu	Popis
`markdown_document`	Kolekce objektů "sections", které představují každý jednotlivý oddíl v dokumentu Markdownu.

Ukázková definice

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Ukázkový výstup

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

Hodnota markdownHeaderDepth určuje počet klíčů ve slovníku oddílů. V ukázkové definici dovednosti, protože markdownHeaderDepth je "h3", existují ve slovníku "oddíly" tři klíče: h1, h2, h3.

Sdílet prostřednictvím