Habilidade de layout de documentos
Nota
Esta funcionalidade está atualmente em pré-visualização pública. Essa visualização é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.
A habilidade Layout do documento analisa um documento para extrair regiões de interesse e suas inter-relações para produzir uma representação sintática do documento no formato Markdown. Essa habilidade usa o modelo de layout de Inteligência Documental fornecido no Azure AI Document Intelligence.
Este artigo é a documentação de referência para a habilidade Layout de documento. Para obter informações de uso, consulte Fragmentação e vetorização com reconhecimento de estrutura.
A habilidade Layout de Documento chama a versão de visualização pública do Document Intelligence 2024-07-31-preview. Atualmente, só está disponível nas seguintes regiões do Azure:
- E.U.A. Leste
- E.U.A. Oeste 2
- Europa Ocidental
- E.U.A. Centro-Norte
Os formatos de ficheiro suportados incluem:
- . JPEG
- .JPG
- .PNG
- .BMP
- . TIFF
- .DOCX
- . XLSX
- .PPTX
- .HTML
Nota
Essa habilidade está vinculada aos serviços de IA do Azure e requer um recurso faturável para transações que excedam 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pré-pago dos serviços de IA do Azure existentes.
@odata.type
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill
Limites de dados
- Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
- Mesmo que o tamanho do arquivo para analisar documentos seja 500 MB para a camada paga (S0) do Azure AI Document Intelligence e 4 MB para a camada gratuita do Azure AI Document Intelligence (F0), a indexação está sujeita aos limites do indexador da sua camada de serviço de pesquisa.
- As dimensões da imagem devem estar entre 50 pixels x 50 pixels ou 10.000 pixels x 10.000 pixels.
- Se os PDFs estiverem bloqueados por senha, remova o bloqueio antes de executar o indexador.
Idiomas suportados
Consulte os idiomas suportados do modelo de layout do Azure AI Document Intelligence para texto impresso.
Limitações
Durante a pré-visualização pública, esta habilidade tem as seguintes restrições:
- A habilidade não pode extrair imagens incorporadas em documentos.
- Os números de página não são incluídos na saída gerada.
- A habilidade não é adequada para documentos grandes que exigem mais de 5 minutos de processamento no modelo de layout AI Document Intelligence. A habilidade expirará, mas as cobranças ainda se aplicarão ao recurso multisserviços de Serviços de IA se ele for anexado ao conjunto de habilidades para fins de faturamento. Certifique-se de que os documentos são otimizados para permanecer dentro dos limites de processamento para evitar custos desnecessários.
Parâmetros de habilidade
Os parâmetros diferenciam maiúsculas de minúsculas.
Nome do parâmetro | Valores Permitidos | Description |
---|---|---|
outputMode |
oneToMany |
Controla a cardinalidade da saída produzida pela habilidade. |
markdownHeaderDepth |
h1 , h2 , h3 , h4 , h5 , h6(default) |
Este parâmetro descreve o nível de aninhamento mais profundo que deve ser considerado. Por exemplo, se markdownHeaderDepth for indicado como "h3", qualquer seção de markdown que seja mais profunda que h3 (ou seja, #### e mais profunda) será considerada como "conteúdo" que precisa ser adicionado a qualquer nível em que seu pai esteja. |
Contributos para as competências
Nome de entrada | Description |
---|---|
file_data |
O arquivo do qual o conteúdo deve ser extraído. |
A entrada "file_data" deve ser um objeto definido como:
{
"$type": "file",
"data": "BASE64 encoded string of the file"
}
Em alternativa, pode ser definido como:
{
"$type": "file",
"url": "URL to download file",
"sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}
O objeto de referência de arquivo pode ser gerado de uma das seguintes maneiras:
Definir o parâmetro na definição do
allowSkillsetToReadFileData
indexador como true. Essa configuração cria um caminho/document/file_data
que é um objeto que representa os dados do arquivo original baixados da fonte de dados de blob. Esse parâmetro só se aplica a arquivos no armazenamento de Blob do Azure.Ter uma habilidade personalizada retornando um objeto JSON definido que fornece
$type
,data
ou esastoken
url
. O$type
parâmetro deve ser definido comofile
, edata
deve ser a matriz de bytes codificada em 64 base do conteúdo do arquivo. Ourl
parâmetro deve ser uma URL válida com acesso para baixar o arquivo nesse local.
Resultados em termos de competências
Nome da saída | Description |
---|---|
markdown_document |
Uma coleção de objetos "sections", que representam cada seção individual no documento Markdown. |
Definição da amostra
{
"skills": [
{
"description": "Analyze a document",
"@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"inputs": [
{
"name": "file_data",
"source": "/document/file_data"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
}
]
}
Saída de exemplo
{
"markdown_document": [
{
"content": "Hi this is Jim \r\nHi this is Joe",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": ""
},
"ordinal_position": 0
},
{
"content": "Hi this is Lance",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": "Boo"
},
"ordinal_position": 1,
}
]
}
O valor do controla markdownHeaderDepth
o número de chaves no dicionário "sections". Na definição de habilidade de exemplo, como o markdownHeaderDepth
é "h3", há três chaves no dicionário "seções": h1, h2, h3.