Delen via


Document Intelligence AMERIKAANSE belastingdocumentmodellen

Deze inhoud is van toepassing op: vinkje v4.0 (GA) | Vorige versies:blauw-vinkje v3.1 (GA) :::moniker-end

Deze inhoud is van toepassing op: vinkje v3.1 (GA) | Nieuwste versie: paars vinkje v4.0 (GA)

Het Document Intelligence-belastingmodel maakt gebruik van krachtige OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden en regelitems uit een selecte groep belastingdocumenten te analyseren en te extraheren. Belastingdocumenten kunnen verschillende indelingen hebben, zoals 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Invoerindeling kan bestaan uit door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel bepaalde Indelingen voor Engelse belastingdocumenten.

Ondersteunde typen belastingformulieren:

  • Unified tax US
  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 en variaties (toegevoegd 1099-SSA)
  • 1040 en variaties
  • 1095A, 1095C
  • W-4

Geautomatiseerde verwerking van belastingdocumenten

Geautomatiseerde verwerking van belastingdocumenten is het proces van het extraheren van sleutelvelden uit belastingdocumenten. Belastingdocumenten werden in het verleden handmatig verwerkt. Met dit model kunt u eenvoudig belastingscenario's automatiseren.

Unified Tax US

Het Unified US Tax vooraf samengestelde model detecteert en extraheert automatisch gegevens uit W2, 1098en 10401099 belastingformulieren in ingediende documenten. Deze documenten kunnen bestaan uit veel belasting- of niet-belastinggerelateerde documenten. Het model verwerkt alleen de formulieren die het ondersteunt.

Schermopname van een diagram voor geïntegreerde belastingverwerking.

Ontwikkelingsopties

Document Intelligence v4.0: 2024-11-30 (GA) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Amerikaanse belastingformuliermodellen Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us• prebuilt-tax.us.w2
• prebuilt-tax.us.W-4
• prebuilt-tax.us.1095A
• prebuilt-tax.us.1095C
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.11099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.< us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H

prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC
• prebuilt-tax.us.1099NEC
• prebuilt-tax.us.1099OID
• prebuilt-tax.us.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.us.1099SB
• prebuilt-tax.us.1099SSA

prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuibuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF

prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Document Intelligence v3.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Amerikaanse belastingformuliermodellen Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.w2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Document Intelligence v3.0 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Amerikaanse belastingformuliermodellen Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.w2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Vereisten voor invoer

  • Ondersteunde bestandsindelingen:

    Modelleren PDF Afbeelding:
    JPEG/JPG, PNG, BMP, , TIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Read
    Indeling
    Algemeen document
    Vooraf gebouwd
    Aangepaste extractie
    Aangepaste classificatie
  • Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.

  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).

  • De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB voor gratis (F0).

  • De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.

  • Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.

  • De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met punttekst 8 op 150 punten per inch (DPI).

  • Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.

    • Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1 GB voor het neurale model.

    • Voor het trainen van aangepast classificatiemodel is 1 de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's. Voor 2024-11-30 (GA) is 2 de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's.

Gegevensextractie van belastingdocument proberen

Bekijk hoe gegevens, waaronder klantgegevens, details van leveranciers en regelitems, worden geëxtraheerd uit facturen. U hebt de volgende resources nodig:

  • Een Azure-abonnement: u kunt er gratis een maken.

  • Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Document Intelligence Studio

  1. Selecteer op de startpagina van Document Intelligence Studio het ondersteunde belastingdocumentmodel.

  2. U kunt een voorbeeld van een belastingdocument analyseren of uw eigen bestanden uploaden.

  3. Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties Analyseren:

    Schermopname van de knoppen Analyse uitvoeren en Opties analyseren in Document Intelligence Studio.

Ondersteunde talen en landinstellingen

Zie onze pagina met vooraf samengestelde modellen voor een volledige lijst met ondersteunde talen.

Veldextractie

Zie de schemapagina's van het belastingdocumentmodel in onze GitHub-voorbeeldopslagplaats voor ondersteunde velden voor documentextractie.

De sleutel-waardeparen van belastingdocumenten en regelitems die zijn geëxtraheerd, bevinden zich in de documentResults sectie van de JSON-uitvoer.

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.