共用方式為


檔版面配置技能

注意

此功能目前處於公開預覽。 此預覽版是在沒有服務等級協定的情況下提供,不建議用於生產工作負載。 可能不支援特定功能,或可能已經限制功能。 如需詳細資訊,請參閱 Microsoft Azure 預覽版增補使用條款

版面配置 技能會分析檔以擷取感興趣的區域及其關聯性,以使用 Markdown 格式產生檔的語法表示法。 此技能使用 Azure AI 檔智慧中所提供的文件智慧版面配置模型。

本文是檔版面配置技能的參考檔。 如需使用資訊,請參閱 結構感知區塊化和向量化

版面配置 技能會呼叫 Document Intelligence 公開預覽版本 2024-07-31-preview。 它目前僅適用於下列 Azure 區域:

  • 美國東部
  • 美國西部 2
  • 西歐
  • 美國中北部

支援的檔案格式包括:

  • .PDF
  • .JPEG
  • .JPG
  • .PNG
  • .BMP
  • .TIFF
  • .DOCX
  • .XLSX
  • .PPTX
  • HTML。

注意

此技能會繫結至 Azure AI 服務,並且每個索引子每天超過 20 個文件的交易需要可計費資源。 內建技能的執行會依現有的 Azure AI 服務預付型方案價格收費。

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

資料限制

  • 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
  • 即使分析文件的檔案大小是 500 MB 的 Azure AI 檔智慧付費層 (S0),而 Azure AI 檔智慧免費層為 4 MB,索引編製仍受限於搜尋服務層級的索引器限制
  • 影像尺寸必須介於 50 像素 x 50 像素或 10,000 像素 x 10,000 像素之間。
  • 如果您的 PDF 已鎖定密碼,請在執行索引器之前先移除鎖定。

支援的語言

如需印刷文字,請參閱 Azure AI 檔智慧版面配置模型支援的語言

限制

在公開預覽期間,此技能有下列限制:

  • 技能無法擷取內嵌在檔中的影像。
  • 產生的輸出中不包含頁碼。
  • 技能不適用於 AI 檔智慧版面配置模型中需要超過 5 分鐘處理的大型檔。 技能將會逾時,但如果技能附加至技能集以供計費之用,則費用仍會套用至 AI Services 多服務資源。 請確定檔已優化,以保持在處理限制內,以避免不必要的成本。

技能參數

這些參數會區分大小寫。

參數名稱 允許的值 描述
outputMode oneToMany 控制技能所產生的輸出基數。
markdownHeaderDepth h1、、h2h3h4、、h5h6(default) 此參數描述應該考慮的最深層巢狀層級。 例如,如果 markdownHeaderDepth 會以 “h3” 表示任何比 h3 更深的 Markdown 區段(也就是 #### 和更深),則會被視為需要新增至其父系位於的任何層級的 “content”。

技能輸入

輸入名稱 描述
file_data 應該從中擷取內容的檔案。

“file_data” 輸入必須是定義為:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

或者,它可以定義為:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

檔案參考物件可以透過下列其中一種方式產生:

  • allowSkillsetToReadFileData 索引器定義上的 參數設定為 true。 此設定會建立代表從 Blob 數據源下載之源文件資料的物件路徑 /document/file_data 。 此參數僅適用於 Azure Blob 記憶體中的檔案。

  • 擁有自訂技能,傳回定義的 JSON 物件,該物件會提供 $typedataurlsastoken$type參數必須設定為 file,而且data必須是檔案內容的基底 64 編碼位元組陣列。 參數 url 必須是具有存取權的有效 URL,才能在該位置下載檔案。

技能輸出

輸出名稱 描述
markdown_document “sections” 物件的集合,代表 Markdown 檔中的每個個別區段。

範例定義

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

範例輸出

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

的值 markdownHeaderDepth 會控制「區段」字典中的索引鍵數目。 在範例技能定義中,因為 markdownHeaderDepth 是 「h3」,因此 「sections」 字典中有三個索引鍵:h1、h2、h3。

另請參閱