Habilidade Layout do Documento

Artigo
02/13/2025

Observação

Esse recurso está atualmente em visualização pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.

A habilidade Layout do Documento analisa um documento para extrair regiões de interesse e suas inter-relações para produzir uma representação sintática do documento no formato Markdown. Essa habilidade usa o modelo de layout do Document Intelligence fornecido no Azure AI Document Intelligence.

Este artigo é a documentação de referência para a habilidade Layout de Documento. Para obter informações de uso, consulte Fragmentação e vetorização com reconhecimento de estrutura.

A habilidade Layout do Documento chama a versão prévia pública do Document Intelligence 2024-07-31-preview. Atualmente, ele só está disponível nas seguintes regiões do Azure:

Leste dos EUA
Oeste dos EUA 2
Europa Ocidental
Centro-Norte dos EUA

Formatos de arquivo com suporte incluem:

PDF.
.JPEG
.JPG
.PNG
.BMP
TIFF
.DOCX
.XLSX
.PPTX
.HTML

Observação

Essa habilidade está associada aos serviços de IA do Azure e requer um recurso faturável para transações que excedem 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pago conforme o uso dos serviços de IA do Azure existentes.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Limites de dados

Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).
Mesmo que o tamanho do arquivo para análise de documentos seja de 500 MB para a camada paga (S0) do Azure AI Document Intelligence e 4 MB para a camada gratuita (F0) do Azure AI Document Intelligence, a indexação estará sujeita aos limites do indexador da camada de serviço de pesquisa.
As dimensões da imagem devem estar entre 50 pixels x 50 pixels ou 10.000 pixels x 10.000 pixels.
Se os PDFs estiverem bloqueados por senha, remova o bloqueio antes de executar o indexador.

Idiomas com suporte

Consulte Idiomas com suporte do modelo de layout do Azure AI Document Intelligence para texto impresso.

Limitações

Durante a visualização pública, essa habilidade tem as seguintes restrições:

A habilidade não pode extrair imagens incorporadas em documentos.
Os números de página não são incluídos na saída gerada.
A habilidade não é adequada para documentos grandes que exigem mais de 5 minutos de processamento no modelo de layout do AI Document Intelligence. A habilidade atingirá o tempo limite, mas as cobranças ainda serão aplicadas ao recurso de vários serviços dos Serviços de IA se ele estiver anexado ao conjunto de habilidades para fins de cobrança. Certifique-se de que os documentos sejam otimizados para permanecer dentro dos limites de processamento para evitar custos desnecessários.

Parâmetros de habilidades

Os parâmetros diferenciam maiúsculas de minúsculas.

Nome do Parâmetro	Valores permitidos	Descrição
`outputMode`	`oneToMany`	Controla a cardinalidade da saída produzida pela habilidade.
`markdownHeaderDepth`	`h1`, `h2`, `h3`, `h4`, `h5`, , `h6(default)`	Esse parâmetro descreve o nível de aninhamento mais profundo que deve ser considerado. Por exemplo, se markdownHeaderDepth for indicado como "h3", qualquer seção de markdown mais profunda que h3 (ou seja, #### e mais profunda) será considerada como "conteúdo" que precisa ser adicionado a qualquer nível em que seu pai esteja.

Entradas de habilidades

Nome de entrada	Descrição
`file_data`	O arquivo do qual o conteúdo deve ser extraído.

A entrada "file_data" precisa ser um objeto definido da seguinte forma:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Alternativamente, ele pode ser definido como:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

O objeto de referência de arquivo pode ser gerado de uma das seguintes maneiras:

Definindo o allowSkillsetToReadFileData parâmetro na definição do indexador como true. Essa configuração cria um caminho /document/file_data que representa os dados do arquivo original baixados da fonte de dados de blob. Esse parâmetro só se aplica a arquivos no Armazenamento de Blobs do Azure.
Ter uma habilidade personalizada retornando um objeto JSON definido que fornece $type, data, ou url e sastoken. O $type parâmetro deve ser definido como filee data deve ser a matriz de bytes codificada em base de 64 do conteúdo do arquivo. O url parâmetro deve ser um URL válido com acesso para baixar o arquivo nesse local.

Saídas de habilidades

Nome de saída	Descrição
`markdown_document`	Uma coleção de objetos "seções", que representam cada seção individual no documento Markdown.

Definição de exemplo

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Saída de exemplo

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

O valor do controla markdownHeaderDepth o número de chaves no dicionário "seções". Na definição de habilidade de exemplo, como o markdownHeaderDepth é "h3", existem três chaves no dicionário de "seções": h1, h2, h3.

Compartilhar via