Usar os modelos Documento Geral, Leitura e Layout

Concluído

Se quiser extrair texto, idiomas e outras informações de documentos com estruturas imprevisíveis, você pode usar os modelos de leitura, documento geral ou layout.

Na sua empresa de sondagens, os clientes e parceiros enviam frequentemente cadernos de encargos, propostas, declarações de trabalho e outros documentos com estruturas imprevisíveis. Você quer saber se o Azure AI Document Intelligence pode analisar e extrair valores desses documentos.

Aqui, você aprenderá sobre os modelos pré-criados que a Microsoft fornece para documentos gerais.

Usando o modelo de leitura

O modelo de leitura do Azure AI Document Intelligence extrai texto impresso e manuscrito de documentos e imagens. É usado para fornecer extração de texto em todos os outros modelos pré-construídos.

O modelo de leitura também pode detetar o idioma em que uma linha de texto está escrita e classificar se é texto manuscrito ou impresso.

Nota

O modelo de leitura suporta mais idiomas para texto impresso do que texto manuscrito. Verifique a documentação para ver a lista atual de idiomas suportados.

Para arquivos PDF ou TIFF de várias páginas, você pode usar o pages parâmetro em sua solicitação para corrigir um intervalo de páginas para a análise.

O modelo de leitura é ideal se você quiser extrair palavras e linhas de documentos sem estrutura fixa ou previsível.

Usando o modelo de documento geral

O modelo de documento geral estende a funcionalidade do modelo de leitura adicionando a deteção de pares chave-valor, entidades, marcas de seleção e tabelas. O modelo pode extrair esses valores de documentos estruturados, semiestruturados e não estruturados.

O modelo de documento geral é o único modelo pré-construído para dar suporte à extração de entidades. Ele pode reconhecer entidades como pessoas, organizações e datas e é executado em todo o documento, não apenas em pares chave-valor. Essa abordagem garante que, quando a complexidade estrutural tiver impedido o modelo de extrair um par chave-valor, uma entidade possa ser extraída. Lembre-se, no entanto, que às vezes uma única parte do texto pode retornar um par chave-valor e uma entidade.

Os tipos de entidades que você pode detetar incluem:

  • Person. O nome de uma pessoa.
  • PersonType. Um cargo ou função.
  • Location. Edifícios, características geográficas, entidades geopolíticas.
  • Organization. Empresas, órgãos governamentais, clubes esportivos, bandas musicais e outros grupos.
  • Event. Encontros sociais, eventos históricos, aniversários.
  • Product. Objetos comprados e vendidos.
  • Skill. Uma capacidade pertencente a uma pessoa.
  • Address. Endereço para correspondência para um local físico.
  • Phone number. Códigos de discagem e números para telefones celulares e fixos.
  • Email. Endereços de e-mail.
  • URL. Endereços de páginas Web.
  • IP Address. Endereços de rede para hardware de computador.
  • DateTime. Datas do calendário e horas do dia.
  • Quantity. Medidas numéricas com as suas unidades.

Usando o modelo de layout

Além de extrair texto, o modelo de layout retorna marcas de seleção e tabelas da imagem de entrada ou do arquivo PDF. É um bom modelo para usar quando você precisa de informações ricas sobre a estrutura de um documento.

Quando você digitaliza um documento, ele pode estar em um ângulo estranho. As tabelas podem ter estruturas complicadas com ou sem cabeçalhos, células que abrangem colunas ou linhas e colunas ou linhas incompletas. O modelo de layout pode lidar com todas essas dificuldades para extrair a estrutura completa do documento.

Por exemplo, cada célula da tabela é extraída com:

  • O texto do seu conteúdo.
  • O tamanho e a posição de sua caixa delimitadora.
  • Se fizer parte de uma coluna de cabeçalho.
  • Índices para indicar sua posição de linha e coluna na tabela.

As marcas de seleção são extraídas com sua caixa delimitadora, um indicador de confiança e se elas estão selecionadas ou não.

Mais informações