Partilhar via


Habilidade de layout de documentos

Nota

Esta funcionalidade está atualmente em pré-visualização pública. Essa visualização é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.

A habilidade Layout do documento analisa um documento para extrair regiões de interesse e suas inter-relações para produzir uma representação sintática do documento no formato Markdown. Essa habilidade usa o modelo de layout de Inteligência Documental fornecido no Azure AI Document Intelligence.

Este artigo é a documentação de referência para a habilidade Layout de documento. Para obter informações de uso, consulte Fragmentação e vetorização com reconhecimento de estrutura.

A habilidade Layout de Documento chama a versão de visualização pública do Document Intelligence 2024-07-31-preview. Atualmente, só está disponível nas seguintes regiões do Azure:

  • E.U.A. Leste
  • E.U.A. Oeste 2
  • Europa Ocidental
  • E.U.A. Centro-Norte

Os formatos de ficheiro suportados incluem:

  • .PDF
  • . JPEG
  • .JPG
  • .PNG
  • .BMP
  • . TIFF
  • .DOCX
  • . XLSX
  • .PPTX
  • .HTML

Nota

Essa habilidade está vinculada aos serviços de IA do Azure e requer um recurso faturável para transações que excedam 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pré-pago dos serviços de IA do Azure existentes.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Limites de dados

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
  • Mesmo que o tamanho do arquivo para analisar documentos seja 500 MB para a camada paga (S0) do Azure AI Document Intelligence e 4 MB para a camada gratuita do Azure AI Document Intelligence (F0), a indexação está sujeita aos limites do indexador da sua camada de serviço de pesquisa.
  • As dimensões da imagem devem estar entre 50 pixels x 50 pixels ou 10.000 pixels x 10.000 pixels.
  • Se os PDFs estiverem bloqueados por senha, remova o bloqueio antes de executar o indexador.

Idiomas suportados

Consulte os idiomas suportados do modelo de layout do Azure AI Document Intelligence para texto impresso.

Limitações

Durante a pré-visualização pública, esta habilidade tem as seguintes restrições:

  • A habilidade não pode extrair imagens incorporadas em documentos.
  • Os números de página não são incluídos na saída gerada.
  • A habilidade não é adequada para documentos grandes que exigem mais de 5 minutos de processamento no modelo de layout AI Document Intelligence. A habilidade expirará, mas as cobranças ainda se aplicarão ao recurso multisserviços de Serviços de IA se ele for anexado ao conjunto de habilidades para fins de faturamento. Certifique-se de que os documentos são otimizados para permanecer dentro dos limites de processamento para evitar custos desnecessários.

Parâmetros de habilidade

Os parâmetros diferenciam maiúsculas de minúsculas.

Nome do parâmetro Valores Permitidos Description
outputMode oneToMany Controla a cardinalidade da saída produzida pela habilidade.
markdownHeaderDepth h1, h2, h3, h4, h5, h6(default) Este parâmetro descreve o nível de aninhamento mais profundo que deve ser considerado. Por exemplo, se markdownHeaderDepth for indicado como "h3", qualquer seção de markdown que seja mais profunda que h3 (ou seja, #### e mais profunda) será considerada como "conteúdo" que precisa ser adicionado a qualquer nível em que seu pai esteja.

Contributos para as competências

Nome de entrada Description
file_data O arquivo do qual o conteúdo deve ser extraído.

A entrada "file_data" deve ser um objeto definido como:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Em alternativa, pode ser definido como:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

O objeto de referência de arquivo pode ser gerado de uma das seguintes maneiras:

  • Definir o parâmetro na definição do allowSkillsetToReadFileData indexador como true. Essa configuração cria um caminho /document/file_data que é um objeto que representa os dados do arquivo original baixados da fonte de dados de blob. Esse parâmetro só se aplica a arquivos no armazenamento de Blob do Azure.

  • Ter uma habilidade personalizada retornando um objeto JSON definido que fornece $type, dataou e sastokenurl . O $type parâmetro deve ser definido como file, e data deve ser a matriz de bytes codificada em 64 base do conteúdo do arquivo. O url parâmetro deve ser uma URL válida com acesso para baixar o arquivo nesse local.

Resultados em termos de competências

Nome da saída Description
markdown_document Uma coleção de objetos "sections", que representam cada seção individual no documento Markdown.

Definição da amostra

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Saída de exemplo

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

O valor do controla markdownHeaderDepth o número de chaves no dicionário "sections". Na definição de habilidade de exemplo, como o markdownHeaderDepth é "h3", há três chaves no dicionário "seções": h1, h2, h3.

Consulte também