檔版面配置技能

發行項
02/13/2025

注意

此功能目前處於公開預覽。此預覽版是在沒有服務等級協定的情況下提供，不建議用於生產工作負載。可能不支援特定功能，或可能已經限制功能。如需詳細資訊，請參閱 Microsoft Azure 預覽版增補使用條款。

檔 版面配置 技能會分析檔以擷取感興趣的區域及其關聯性，以使用 Markdown 格式產生檔的語法表示法。此技能使用 Azure AI 檔智慧中所提供的文件智慧版面配置模型。

本文是檔版面配置技能的參考檔。如需使用資訊，請參閱結構感知區塊化和向量化。

檔 版面配置 技能會呼叫 Document Intelligence 公開預覽版本 2024-07-31-preview。它目前僅適用於下列 Azure 區域：

美國東部
美國西部 2
西歐
美國中北部

支援的檔案格式包括：

.PDF
.JPEG
.JPG
.PNG
.BMP
.TIFF
.DOCX
.XLSX
.PPTX
HTML。

注意

此技能會繫結至 Azure AI 服務，並且每個索引子每天超過 20 個文件的交易需要可計費資源。內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

資料限制

若使用 PDF 和 TIFF，最多可處理 2,000 頁 (若使用免費層訂閱，則只會處理前兩頁)。
即使分析文件的檔案大小是 500 MB 的 Azure AI 檔智慧付費層（S0）層，而 Azure AI 檔智慧免費層為 4 MB，索引編製仍受限於搜尋服務層級的索引器限制。
影像尺寸必須介於 50 像素 x 50 像素或 10,000 像素 x 10,000 像素之間。
如果您的 PDF 已鎖定密碼，請在執行索引器之前先移除鎖定。

支援的語言

如需印刷文字，請參閱 Azure AI 檔智慧版面配置模型支援的語言。

限制

在公開預覽期間，此技能有下列限制：

技能無法擷取內嵌在檔中的影像。
產生的輸出中不包含頁碼。
技能不適用於 AI 檔智慧版面配置模型中需要超過 5 分鐘處理的大型檔。技能將會逾時，但如果技能附加至技能集以供計費之用，則費用仍會套用至 AI Services 多服務資源。請確定檔已優化，以保持在處理限制內，以避免不必要的成本。

技能參數

這些參數會區分大小寫。

參數名稱	允許的值	描述
`outputMode`	`oneToMany`	控制技能所產生的輸出基數。
`markdownHeaderDepth`	`h1`、、`h2h3`、`h4`、、`h5`、`h6(default)`	此參數描述應該考慮的最深層巢狀層級。例如，如果 markdownHeaderDepth 會以 “h3” 表示任何比 h3 更深的 Markdown 區段（也就是 #### 和更深），則會被視為需要新增至其父系位於的任何層級的 “content”。

技能輸入

輸入名稱	描述
`file_data`	應該從中擷取內容的檔案。

“file_data” 輸入必須是定義為：

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

或者，它可以定義為：

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

檔案參考物件可以透過下列其中一種方式產生：

將 allowSkillsetToReadFileData 索引器定義上的參數設定為 true。此設定會建立代表從 Blob 數據源下載之源文件資料的物件路徑 /document/file_data 。此參數僅適用於 Azure Blob 記憶體中的檔案。
擁有自訂技能，傳回定義的 JSON 物件，該物件會提供 $type、 data或 url 和 sastoken。 $type參數必須設定為 file，而且data必須是檔案內容的基底 64 編碼位元組陣列。參數 url 必須是具有存取權的有效 URL，才能在該位置下載檔案。

技能輸出

輸出名稱	描述
`markdown_document`	“sections” 物件的集合，代表 Markdown 檔中的每個個別區段。

範例定義

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

範例輸出

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

的值 markdownHeaderDepth 會控制「區段」字典中的索引鍵數目。在範例技能定義中，因為 markdownHeaderDepth 是「h3」，因此「sections」字典中有三個索引鍵：h1、h2、h3。

共用方式為