Sdílet prostřednictvím


Dovednost rozložení dokumentu

Poznámka:

Tato funkce je v současné době ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučuje se pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Dovednost Rozložení dokumentu analyzuje dokument tak, aby extrahoval oblasti zájmu a jejich vzájemné vztahy a vytvořil syntaktické znázornění dokumentu ve formátu Markdownu. Tato dovednost používá model rozložení Document Intelligence poskytovaný v Azure AI Document Intelligence.

Tento článek je referenční dokumentací pro dovednosti rozložení dokumentu. Informace o použití najdete v tématu Vytváření bloků dat a vektorizace s podporou struktur.

Dovednost Rozložení dokumentu volá verzi Public Preview funkce Document Intelligence verze 2024-07-31-preview. V současné době je k dispozici pouze v následujících oblastech Azure:

  • USA – východ
  • USA – západ 2
  • Západní Evropa
  • Severní střed USA

Mezi podporované formáty souborů patří:

  • .PDF
  • . JPEG
  • .JPG
  • .PNG
  • .BMP
  • . HÁDKA
  • .DOCX
  • . XLSX
  • .PPTX
  • .HTML

Poznámka:

Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Omezení dat

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
  • I když je velikost souboru pro analýzu dokumentů 500 MB pro placenou úroveň Azure AI Document Intelligence (S0) a 4 MB pro úroveň Azure AI Document Intelligence Free (F0), indexování podléhá omezením indexeru vaší úrovně vyhledávací služby.
  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů nebo 10 000 pixelů x 10 000 pixelů.
  • Pokud jsou soubory PDF uzamčené heslem, před spuštěním indexeru ho odeberte.

Podporované jazyky

Informace o tištěných textech najdete v podporovaných jazycích modelu rozložení Azure AI Document Intelligence.

Omezení

Ve verzi Public Preview má tato dovednost následující omezení:

  • Dovednost nemůže extrahovat obrázky vložené do dokumentů.
  • Čísla stránek nejsou zahrnuta do vygenerovaného výstupu.
  • Dovednost není vhodná pro velké dokumenty vyžadující více než 5 minut zpracování v modelu rozložení AI Document Intelligence. Dovednost vyprší, ale poplatky se budou dál vztahovat na prostředek s více službami AI, pokud je připojen k sadě dovedností pro účely fakturace. Ujistěte se, že jsou dokumenty optimalizované tak, aby zůstaly v mezích limitů zpracování, abyste se vyhnuli zbytečným nákladům.

Parametry dovedností

Parametry rozlišují malá a velká písmena.

Název parametru Povolené hodnoty Popis
outputMode oneToMany Řídí kardinalitu výstupu vytvořeného dovedností.
markdownHeaderDepth h1, h2, h3, h4, , h5h6(default) Tento parametr popisuje nejnižší úroveň vnoření, kterou byste měli zvážit. Pokud je například markdownHeaderDepth označený jako "h3" jakýkoli oddíl markdownu, který je hlubší než h3 (tj. #### a hlubší), považuje se za "obsah", který je potřeba přidat do jakékoli úrovně, na které je nadřazený objekt.

Vstupy dovedností

Název vstupu Popis
file_data Soubor, ze kterého se má obsah extrahovat.

Vstup "file_data" musí být objekt definovaný takto:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Alternativně se dá definovat takto:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

Objekt odkazu na soubor lze vygenerovat jedním z následujících způsobů:

  • Nastavení parametru v definici indexeru allowSkillsetToReadFileData na hodnotu true. Toto nastavení vytvoří cestu /document/file_data , která představuje původní data souboru stažená ze zdroje dat objektu blob. Tento parametr platí jenom pro soubory ve službě Azure Blob Storage.

  • Mít vlastní dovednosti vracející objekt JSON definovaný, který poskytuje $type, datanebo url a sastoken. Parametr $type musí být nastaven na filehodnotu a data musí být základním polem 64 bajtů obsahu souboru. Parametr url musí být platnou adresou URL s přístupem ke stažení souboru v daném umístění.

Výstupy dovedností

Název výstupu Popis
markdown_document Kolekce objektů "sections", které představují každý jednotlivý oddíl v dokumentu Markdownu.

Ukázková definice

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Ukázkový výstup

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

Hodnota markdownHeaderDepth určuje počet klíčů ve slovníku oddílů. V ukázkové definici dovednosti, protože markdownHeaderDepth je "h3", existují ve slovníku "oddíly" tři klíče: h1, h2, h3.

Viz také