Compartilhar via


Modelos de documento fiscal dos EUA da Informação de Documentos

Esse conteúdo se aplica a: marca de seleçãov4.0 (GA) | Versões anteriores: marca de seleção azul v3.1 (GA):::moniker-end

Esse conteúdo se aplica a: marca de seleção v3.1 (GA) | Última versão: marca de seleção púrpura v4.0 (GA)

O modelo tributário da Informação de Documentos usa recursos poderosos de Reconhecimento Óptico de Caracteres (OCR) para analisar e extrair campos e itens de linha importantes de um grupo seleto de documentos tributários. Os documentos tributários podem ser de vários formatos, como 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. O formato de entrada pode incluir imagens capturadas por celular, documentos digitalizados e PDFs digitais. A API analisa textos, extrai informações importantes e retorna uma representação de dados JSON estruturada de documentos. O modelo atualmente dá suporte a determinados formatos de documentos fiscais em inglês.

Tipos de formulários fiscais com suporte:

  • Imposto unificado dos EUA
  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 e variações (adicionado 1099-SSA)
  • 1040 e variações
  • 1095A, 1095C
  • W-4

Processamento automatizado de documentos fiscais

O processamento automatizado de documentos fiscais é o processo de extração de campos-chave de documentos fiscais. Historicamente, os documentos fiscais eram processados manualmente. Esse modelo permite a fácil automação de cenários fiscais.

Imposto unificado dos EUA

O modelo predefinido Unified US Tax detecta e extrai dados automaticamente dos formulários fiscais W2, 1098, 1040 e 1099nos documentos enviados. Esses documentos podem ser compostos por muitos documentos fiscais ou não relacionados a impostos. O modelo processa apenas os formulários aos quais dá suporte.

Captura de tela de um diagrama de processamento de imposto unificado.

Opções de desenvolvimento

A Informação de Documentos v4.0: 2024-11-30 (GA) oferece suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelos de formulário fiscal dos EUA Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
• prebuilt-tax.us
• prebuilt-tax.us.W-2
• prebuilt-tax.us.W-4
• prebuilt-tax.us.1095A
• prebuilt-tax.us.1095C
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC
• prebuilt-tax.us.1099NEC
• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1099SSA
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

A Informação de Documentos v3.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelos de formulário fiscal dos EUA Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

A Informação de Documentos v3.0 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
Modelos de formulário fiscal dos EUA Estúdio de Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Requisitos de entrada

  • Formatos de arquivo com suporte:

    Modelar PDF Image,:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Ler
    Layout
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada
  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente 8 pontos de texto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.

    • Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de 1 GB, com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é 2 GB com um máximo de 10.000 páginas.

Experimente a extração de dados de documentos fiscais

Veja como os dados, incluindo informações do cliente, detalhes do fornecedor e itens de linha, são extraídos das notas fiscais. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Estúdio de Informação de Documentos

  1. Na página inicial do Estúdio de Informação de Documentos, selecione modelos de documentos fiscais compatíveis.

  2. Você pode analisar um documento fiscais de amostra ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões de opções Executar análise e Analisar no Document Intelligence Studio.

Idiomas e localidades com suporte

Confira nossa página Suporte ao idioma – modelos predefinidos, para obter uma lista completa dos idiomas compatíveis.

Extração de campo

Para os campos de extração de documentos com suporte, confira as páginas de esquema de modelo de documento tributário em nosso repositório de amostras do GitHub.

Os pares de chave-valor dos documentos fiscais e os itens de linha extraídos estão na seção documentResults da saída JSON.

Próximas etapas