다음을 통해 공유


문서 레이아웃 기술

참고 항목

이 기능은 현재 공개 미리 보기로 제공됩니다. 이 미리 보기는 서비스 수준 계약 없이 제공되며 프로덕션 워크로드에는 사용하지 않는 것이 좋습니다. 특정 기능이 지원되지 않거나 기능이 제한될 수 있습니다. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.

문서 레이아웃 기술은 문서를 분석하여 관심 영역과 해당 상호 관계를 추출하여 Markdown 형식으로 문서의 구문 표현을 생성합니다. 이 기술은 Azure AI Document Intelligence에 제공된 문서 인텔리전스 레이아웃 모델을 사용합니다.

이 문서는 문서 레이아웃 기술에 대한 참조 설명서입니다. 사용량 정보는 구조 인식 청크 및 벡터화를 참조 하세요.

문서 레이아웃 기술은 Document Intelligence 공개 미리 보기 버전 2024-07-31-preview를 호출합니다. 현재 다음 Azure 지역에서만 사용할 수 있습니다.

  • 미국 동부
  • 미국 서부2
  • 서유럽
  • 미국 중북부

지원되는 파일 형식은 다음과 같습니다.

  • PDF.
  • . JPEG
  • .JPG
  • .PNG
  • .BMP
  • . TIFF
  • .DOCX
  • .XLSX
  • .PPTX
  • .HTML

참고 항목

이 기술은 Azure AI 서비스에 바인딩되며, 하루에 인덱서당 20개의 문서를 초과하는 트랜잭션에 대해 청구 가능한 리소스를 필요로 합니다. 기본 제공 기술을 실행하는 요금은 기존 Azure AI 서비스 종량제 가격으로 청구됩니다.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

데이터 제한

  • PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).
  • 문서를 분석하기 위한 파일 크기가 Azure AI S0(문서 인텔리전스 유료) 계층의 경우 500MB이고 Azure AI Document Intelligence 무료(F0) 계층의 경우 4MB인 경우에도 인덱싱은 검색 서비스 계층의 인덱서 제한이 적용됩니다.
  • 이미지 크기는 50픽셀 x 50픽셀 또는 10,000픽셀 x 10,000픽셀 사이여야 합니다.
  • PDF가 암호로 잠긴 경우 인덱서 실행 전에 잠금을 제거합니다.

지원되는 언어

인쇄된 텍스트에 대해 지원되는 Azure AI Document Intelligence 레이아웃 모델을 참조하세요 .

제한 사항

공개 미리 보기 중에 이 기술에는 다음과 같은 제한 사항이 있습니다.

  • 기술은 문서에 포함된 이미지를 추출할 수 없습니다.
  • 페이지 번호는 생성된 출력에 포함되지 않습니다.
  • 이 기술은 AI 문서 인텔리전스 레이아웃 모델에서 5분 이상 처리해야 하는 대규모 문서에 적합하지 않습니다. 기술은 시간이 초과되지만 청구 목적으로 기술 세트에 연결된 경우 AI Services 다중 서비스 리소스에 요금이 계속 적용됩니다. 불필요한 비용을 방지하기 위해 문서가 처리 제한 내에서 유지되도록 최적화되어 있는지 확인합니다.

기술 매개 변수

매개 변수는 대/소문자를 구분합니다.

매개 변수 이름 허용되는 값 설명
outputMode oneToMany 기술에 의해 생성된 출력의 카디널리티를 제어합니다.
markdownHeaderDepth h1, h2, h3, h4, h5h6(default) 이 매개 변수는 고려해야 할 가장 깊은 중첩 수준을 설명합니다. 예를 들어 markdownHeaderDepth가 "h3"으로 표시되는 경우 h3보다 더 깊은 마크다운 섹션(즉, #### 및 심층)은 부모가 있는 수준에 추가해야 하는 "콘텐츠"로 간주됩니다.

기술 입력

입력 이름 설명
file_data 콘텐츠를 추출해야 하는 파일입니다.

"file_data" 입력은 다음과 같이 정의된 개체여야 합니다.

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

또는 다음과 같이 정의할 수 있습니다.

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

파일 참조 개체는 다음 방법 중 하나로 생성할 수 있습니다.

  • 인덱서 정의의 allowSkillsetToReadFileData 매개 변수를 true로 설정합니다. 이 설정은 Blob 데이터 원본에서 다운로드한 원래 파일 데이터를 나타내는 개체의 경로를 /document/file_data 만듭니다. 이 매개 변수는 Azure Blob Storage의 파일에만 적용됩니다.

  • 정의 $typedataurl sastoken한 JSON 개체를 반환하는 사용자 지정 기술이 있는 경우 매개 변수는 $type 파일 filedata 콘텐츠의 base 64로 인코딩된 바이트 배열이어야 합니다. 매개 변수는 url 해당 위치에서 파일을 다운로드하기 위한 액세스 권한이 있는 유효한 URL이어야 합니다.

기술 출력

출력 이름 설명
markdown_document Markdown 문서의 각 개별 섹션을 나타내는 "section" 개체의 컬렉션입니다.

샘플 정의

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

샘플 출력

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

markdownHeaderDepth 은 "섹션" 사전의 키 수를 제어합니다. 예제 기술 정의 markdownHeaderDepth 에서 "h3"이므로 "섹션" 사전에는 h1, h2, h3의 세 가지 키가 있습니다.

참고 항목