Freigeben über


Dokument Intelligenz US-Steuerdokumentmodell

Dieser Inhalt gilt für: Häkchen Version 4.0 (GA) | Vorherige Versionen: Blaues Häkchen Version 3.1 (GA) :::moniker-end

Dieser Inhalt gilt für: Häkchen Version 3.1 (GA) | Aktuelle Version: Lila Häkchen Version 4.0 (GA)

Das Dokument Intelligenz-Steuermodell nutzt leistungsstarke Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR), um Schlüsselfelder und Positionen aus ausgewählten Steuerdokumenten zu analysieren und zu extrahieren. Steuerdokumente können verschiedene Formate aufweisen, wie z. B. 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Zu den Eingabeformaten gehören per Telefon aufgenommene Fotos, gescannte Dokumente und digitale PDFs. Die API analysiert Dokumenttext, extrahiert wichtige Informationen und gibt eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit bestimmte englische Steuerdokumentformate.

Unterstützte Steuerformulartypen:

  • Unified Tax US
  • W-2
  • 1.098
  • 1098-E
  • 1098-T
  • 1099 und Variationen (1099-SSA hinzugefügt)
  • 1040 und Variationen
  • 1095A, 1095C
  • W-4

Automatisierte Verarbeitung von Steuerdokumenten

Bei der automatisierten Verarbeitung von Steuerdokumenten werden Schlüsselfelder aus Steuerdokumenten extrahiert. In der Vergangenheit wurden Steuerdokumente manuell verarbeitet. Dieses Modell ermöglicht die einfache Automatisierung von Steuerszenarien.

Unified Tax US

Das vordefinierte Modell Unified US Tax erkennt und extrahiert Daten aus den Steuerformularen W2, 1098, 1040 und 1099 in übermittelten Dokumenten automatisch. Diese Dokumente können aus vielen steuerbezogenen oder nicht steuerbezognene Dokumenten bestehen. Das Modell verarbeitet nur die unterstützten Formulare.

Screenshot: Unified Tax-Verarbeitungsdiagramm

Entwicklungsoptionen

Dokument Intelligenz Version 4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
US-Steuerformularmodelle Document Intelligence Studio
REST-API
C#SDK
SDK für Python
Java SDK
JavaScript SDK
• prebuilt-tax.us
• prebuilt-tax.us.W-2
• prebuilt-tax.us.W-4
• prebuilt-tax.us.1095A
• prebuilt-tax.us.1095C
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC
• prebuilt-tax.us.1099NEC
• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1099SSA
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Dokument-Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
US-Steuerformularmodelle Document Intelligence Studio
REST-API
C#SDK
SDK für Python
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Dokument Intelligenz v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
US-Steuerformularmodelle Document Intelligence Studio
REST-API
C#SDK
SDK für Python
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Eingabeanforderungen

  • Unterstützte Dateiformate:

    Modell PDF Abbildung:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lesen Sie
    Layout
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung
  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • In den Formaten PDF und TIFF können bis zu 2,000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für den kostenpflichtigen Tarif (S0) und 4 MB für den kostenlosen Tarif (F0).

  • Die Bildgröße muss zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkttext bei 150 Punkten pro Zoll (Dots Per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training benutzerdefinierter Extraktionsmodelle beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1 GB für das neuronale Modell.

    • Für das Training benutzerdefinierter Klassifizierungsmodelle beträgt die Gesamtgröße der Trainingsdaten 1 GB bei maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Trainingsdaten 2 GB bei maximal 10.000 Seiten.

Testen der Datenextraktion bei Steuerdokumenten

Erfahren Sie, wie Daten, einschließlich Kundeninformationen, Herstellerdetails und Positionen, aus Rechnungen extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Document Intelligence Studio das unterstützte Model für Steuerdokumente aus.

  2. Sie können ein Beispielsteuerdokument analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen :

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.

Feldextraktion

Weitere Informationen zu unterstützten Feldern für die Dokumentextraktion finden Sie in unserem GitHub-Beispielrepository auf der Seite mit dem Modellschema für Steuerdokumente.

Die extrahierten Schlüssel-Wert-Paare der Steuerdokumente und die Rechnungspositionen befinden sich im Abschnitt documentResults der JSON-Ausgabe.

Nächste Schritte