Dovednost rozložení dokumentu
Poznámka:
Tato funkce je v současné době ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučuje se pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.
Dovednost Rozložení dokumentu analyzuje dokument tak, aby extrahoval oblasti zájmu a jejich vzájemné vztahy a vytvořil syntaktické znázornění dokumentu ve formátu Markdownu. Tato dovednost používá model rozložení Document Intelligence poskytovaný v Azure AI Document Intelligence.
Tento článek je referenční dokumentací pro dovednosti rozložení dokumentu. Informace o použití najdete v tématu Vytváření bloků dat a vektorizace s podporou struktur.
Dovednost Rozložení dokumentu volá verzi Public Preview funkce Document Intelligence verze 2024-07-31-preview. V současné době je k dispozici pouze v následujících oblastech Azure:
- USA – východ
- USA – západ 2
- Západní Evropa
- Severní střed USA
Mezi podporované formáty souborů patří:
- . JPEG
- .JPG
- .PNG
- .BMP
- . HÁDKA
- .DOCX
- . XLSX
- .PPTX
- .HTML
Poznámka:
Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.
@odata.type
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill
Omezení dat
- U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
- I když je velikost souboru pro analýzu dokumentů 500 MB pro placenou úroveň Azure AI Document Intelligence (S0) a 4 MB pro úroveň Azure AI Document Intelligence Free (F0), indexování podléhá omezením indexeru vaší úrovně vyhledávací služby.
- Rozměry obrázku musí být mezi 50 pixely x 50 pixelů nebo 10 000 pixelů x 10 000 pixelů.
- Pokud jsou soubory PDF uzamčené heslem, před spuštěním indexeru ho odeberte.
Podporované jazyky
Informace o tištěných textech najdete v podporovaných jazycích modelu rozložení Azure AI Document Intelligence.
Omezení
Ve verzi Public Preview má tato dovednost následující omezení:
- Dovednost nemůže extrahovat obrázky vložené do dokumentů.
- Čísla stránek nejsou zahrnuta do vygenerovaného výstupu.
- Dovednost není vhodná pro velké dokumenty vyžadující více než 5 minut zpracování v modelu rozložení AI Document Intelligence. Dovednost vyprší, ale poplatky se budou dál vztahovat na prostředek s více službami AI, pokud je připojen k sadě dovedností pro účely fakturace. Ujistěte se, že jsou dokumenty optimalizované tak, aby zůstaly v mezích limitů zpracování, abyste se vyhnuli zbytečným nákladům.
Parametry dovedností
Parametry rozlišují malá a velká písmena.
Název parametru | Povolené hodnoty | Popis |
---|---|---|
outputMode |
oneToMany |
Řídí kardinalitu výstupu vytvořeného dovedností. |
markdownHeaderDepth |
h1 , h2 , h3 , h4 , , h5 h6(default) |
Tento parametr popisuje nejnižší úroveň vnoření, kterou byste měli zvážit. Pokud je například markdownHeaderDepth označený jako "h3" jakýkoli oddíl markdownu, který je hlubší než h3 (tj. #### a hlubší), považuje se za "obsah", který je potřeba přidat do jakékoli úrovně, na které je nadřazený objekt. |
Vstupy dovedností
Název vstupu | Popis |
---|---|
file_data |
Soubor, ze kterého se má obsah extrahovat. |
Vstup "file_data" musí být objekt definovaný takto:
{
"$type": "file",
"data": "BASE64 encoded string of the file"
}
Alternativně se dá definovat takto:
{
"$type": "file",
"url": "URL to download file",
"sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}
Objekt odkazu na soubor lze vygenerovat jedním z následujících způsobů:
Nastavení parametru v definici indexeru
allowSkillsetToReadFileData
na hodnotu true. Toto nastavení vytvoří cestu/document/file_data
, která představuje původní data souboru stažená ze zdroje dat objektu blob. Tento parametr platí jenom pro soubory ve službě Azure Blob Storage.Mít vlastní dovednosti vracející objekt JSON definovaný, který poskytuje
$type
,data
nebourl
asastoken
. Parametr$type
musí být nastaven nafile
hodnotu adata
musí být základním polem 64 bajtů obsahu souboru. Parametrurl
musí být platnou adresou URL s přístupem ke stažení souboru v daném umístění.
Výstupy dovedností
Název výstupu | Popis |
---|---|
markdown_document |
Kolekce objektů "sections", které představují každý jednotlivý oddíl v dokumentu Markdownu. |
Ukázková definice
{
"skills": [
{
"description": "Analyze a document",
"@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"inputs": [
{
"name": "file_data",
"source": "/document/file_data"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
}
]
}
Ukázkový výstup
{
"markdown_document": [
{
"content": "Hi this is Jim \r\nHi this is Joe",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": ""
},
"ordinal_position": 0
},
{
"content": "Hi this is Lance",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": "Boo"
},
"ordinal_position": 1,
}
]
}
Hodnota markdownHeaderDepth
určuje počet klíčů ve slovníku oddílů. V ukázkové definici dovednosti, protože markdownHeaderDepth
je "h3", existují ve slovníku "oddíly" tři klíče: h1, h2, h3.