Usar os modelos de Documento Geral, Leitura e Layout

3 minutos

Se você quiser extrair texto, idiomas e outras informações de documentos com estruturas imprevisíveis, use os modelos de leitura, documento geral ou layout.

Em sua empresa de pesquisas, clientes e parceiros geralmente enviam especificações, propostas, declarações de trabalho e outros documentos com estruturas imprevisíveis. Você deseja saber se a IA do Azure para Informação de Documentos pode analisar e extrair valores desses documentos.

Aqui, você aprenderá sobre os modelos predefinidos que a Microsoft fornece para documentos gerais.

Como usar o modelo de leitura

O modelo de leitura da IA do Azure para Informação de Documentos extrai texto impresso e manuscrito de documentos e imagens. Ele é usado para fornecer extração de texto em todos os outros modelos predefinidos.

O modelo de leitura também pode detectar o idioma no qual uma linha de texto está escrita e classificar se ele é manuscrito ou impresso.

Observação

O modelo de leitura dá suporte a mais idiomas para texto impresso do que para texto manuscrito. Verifique a documentação para ver a lista atual de idiomas com suporte.

Para arquivos PDF ou TIFF de várias páginas, você pode usar o parâmetro pages em sua solicitação para corrigir um intervalo de páginas para a análise.

O modelo de leitura é ideal se você quiser extrair palavras e linhas de documentos sem uma estrutura fixa ou previsível.

Como usar o modelo de documento geral

O modelo de documento geral estende a funcionalidade do modelo de leitura adicionando a detecção de pares chave-valor, entidades, marcas de seleção e tabelas. O modelo consegue extrair esses valores de documentos estruturados, semiestruturados e não estruturados.

O modelo de documento geral é o único modelo predefinido para dar suporte à extração de entidades. Ele consegue reconhecer entidades como pessoas, organizações e datas e é executado em todo o documento, não apenas em pares chave-valor. Essa abordagem garante que, quando a complexidade estrutural impede que o modelo extraia um par chave-valor, uma entidade possa ser extraída. Lembre-se, no entanto, de que, às vezes, uma única parte do texto pode retornar um par chave-valor e uma entidade.

Os tipos de entidades que você pode detectar incluem:

Person. O nome de uma pessoa.
Person. Um cargo ou função.
Person. Edifícios, recursos geográficos, entidades geopolíticas.
Person. Empresas, órgãos governamentais, clubes esportivos, bandas musicais e outros grupos.
Person. Reuniões sociais, eventos históricos, aniversários.
Person. Objetos comprados e vendidos.
Person. Uma capacidade que pertence a uma pessoa.
Person. Endereço de correspondência de um local físico.
Person. Códigos de discagem e números de telefones celulares e fixos.
Person. Endereços de email.
Person. Endereços de páginas da Web.
Person. Endereços de rede de hardware do computador.
Person. Datas do calendário e horas do dia.
Person. Medidas numéricas com as respectivas unidades.

Como usar o modelo de layout

Além de extrair texto, o modelo de layout retorna marcas de seleção e tabelas da imagem analisada ou do arquivo PDF. Esse é um bom modelo a ser usado quando você precisa de informações avançadas sobre a estrutura de um documento.

Quando você digitaliza um documento, ele pode ficar em um ângulo estranho. As tabelas podem ter estruturas complicadas com ou sem cabeçalhos, células que abrangem colunas ou linhas e colunas ou linhas incompletas. O modelo de layout pode lidar com todas essas dificuldades para extrair a estrutura completa do documento.

Por exemplo, cada célula de tabela é extraída com:

O texto de seu conteúdo.
O tamanho e a posição de sua caixa delimitadora.
Se faz parte de uma coluna de cabeçalho.
Índices para indicar a posição da linha e coluna na tabela.

As marcas de seleção são extraídas com a caixa delimitadora, um indicador de confiança e se elas estão selecionadas ou não.

Como usar o modelo de leitura

Como usar o modelo de documento geral

Como usar o modelo de layout

Saiba mais

Comentários