檔版面配置技能
注意
此功能目前處於公開預覽。 此預覽版是在沒有服務等級協定的情況下提供,不建議用於生產工作負載。 可能不支援特定功能,或可能已經限制功能。 如需詳細資訊,請參閱 Microsoft Azure 預覽版增補使用條款。
檔 版面配置 技能會分析檔以擷取感興趣的區域及其關聯性,以使用 Markdown 格式產生檔的語法表示法。 此技能使用 Azure AI 檔智慧中所提供的文件智慧版面配置模型。
本文是檔版面配置技能的參考檔。 如需使用資訊,請參閱 結構感知區塊化和向量化。
檔 版面配置 技能會呼叫 Document Intelligence 公開預覽版本 2024-07-31-preview。 它目前僅適用於下列 Azure 區域:
- 美國東部
- 美國西部 2
- 西歐
- 美國中北部
支援的檔案格式包括:
- .JPEG
- .JPG
- .PNG
- .BMP
- .TIFF
- .DOCX
- .XLSX
- .PPTX
- HTML。
注意
此技能會繫結至 Azure AI 服務,並且每個索引子每天超過 20 個文件的交易需要可計費資源。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。
@odata.type
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill
資料限制
- 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
- 即使分析文件的檔案大小是 500 MB 的 Azure AI 檔智慧付費層 (S0) 層,而 Azure AI 檔智慧免費層為 4 MB,索引編製仍受限於搜尋服務層級的索引器限制。
- 影像尺寸必須介於 50 像素 x 50 像素或 10,000 像素 x 10,000 像素之間。
- 如果您的 PDF 已鎖定密碼,請在執行索引器之前先移除鎖定。
支援的語言
如需印刷文字,請參閱 Azure AI 檔智慧版面配置模型支援的語言。
限制
在公開預覽期間,此技能有下列限制:
- 技能無法擷取內嵌在檔中的影像。
- 產生的輸出中不包含頁碼。
- 技能不適用於 AI 檔智慧版面配置模型中需要超過 5 分鐘處理的大型檔。 技能將會逾時,但如果技能附加至技能集以供計費之用,則費用仍會套用至 AI Services 多服務資源。 請確定檔已優化,以保持在處理限制內,以避免不必要的成本。
技能參數
這些參數會區分大小寫。
參數名稱 | 允許的值 | 描述 |
---|---|---|
outputMode |
oneToMany |
控制技能所產生的輸出基數。 |
markdownHeaderDepth |
h1 、、h2 h3 、h4 、、h5 、h6(default) |
此參數描述應該考慮的最深層巢狀層級。 例如,如果 markdownHeaderDepth 會以 “h3” 表示任何比 h3 更深的 Markdown 區段(也就是 #### 和更深),則會被視為需要新增至其父系位於的任何層級的 “content”。 |
技能輸入
輸入名稱 | 描述 |
---|---|
file_data |
應該從中擷取內容的檔案。 |
“file_data” 輸入必須是定義為:
{
"$type": "file",
"data": "BASE64 encoded string of the file"
}
或者,它可以定義為:
{
"$type": "file",
"url": "URL to download file",
"sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}
檔案參考物件可以透過下列其中一種方式產生:
將
allowSkillsetToReadFileData
索引器定義上的 參數設定為 true。 此設定會建立代表從 Blob 數據源下載之源文件資料的物件路徑/document/file_data
。 此參數僅適用於 Azure Blob 記憶體中的檔案。擁有自訂技能,傳回定義的 JSON 物件,該物件會提供
$type
、data
或url
和sastoken
。$type
參數必須設定為file
,而且data
必須是檔案內容的基底 64 編碼位元組陣列。 參數url
必須是具有存取權的有效 URL,才能在該位置下載檔案。
技能輸出
輸出名稱 | 描述 |
---|---|
markdown_document |
“sections” 物件的集合,代表 Markdown 檔中的每個個別區段。 |
範例定義
{
"skills": [
{
"description": "Analyze a document",
"@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"inputs": [
{
"name": "file_data",
"source": "/document/file_data"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
}
]
}
範例輸出
{
"markdown_document": [
{
"content": "Hi this is Jim \r\nHi this is Joe",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": ""
},
"ordinal_position": 0
},
{
"content": "Hi this is Lance",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": "Boo"
},
"ordinal_position": 1,
}
]
}
的值 markdownHeaderDepth
會控制「區段」字典中的索引鍵數目。 在範例技能定義中,因為 markdownHeaderDepth
是 「h3」,因此 「sections」 字典中有三個索引鍵:h1、h2、h3。