Document Intelligence-bankinstructiemodel
Het document intelligence bankafschriftmodel combineert krachtige OCR-mogelijkheden (Optical Character Recognition) met deep learning-modellen voor het analyseren en extraheren van gegevens uit Amerikaanse bankafschriften. De API analyseert afgedrukte bankafschriften; haalt belangrijke informatie op, zoals rekeningnummer, bankgegevens, afschriftgegevens, transactiegegevens en kosten; en retourneert een gestructureerde JSON-gegevensweergave.
Functie | version | Model-id |
---|---|---|
Bankinstructiemodel | • v4.0:2024-07-31 (preview) | prebuilt-bankStatement.us |
Gegevensextractie van bankafschriften
Een bankoverzicht helpt bij het controleren van de activiteiten van een rekening tijdens een opgegeven periode. Het is een officiële verklaring die helpt bij het detecteren van fraude, het bijhouden van uitgaven, boekhoudfouten en het vastleggen van de activiteiten van de periode. Bekijk hoe gegevens worden geëxtraheerd met behulp van het prebuilt-bankStatement.us
model. U hebt de volgende resources nodig:
Een Azure-abonnement: u kunt er gratis een maken
Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (
F0
) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.
Document Intelligence Studio
Selecteer bankafschriften op de startpagina van Document Intelligence Studio.
U kunt het voorbeeld van een bankoverzicht analyseren of uw eigen bestanden uploaden.
Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties Analyseren:
Vereisten voor invoer
Ondersteunde bestandsindelingen:
Modelleren PDF Afbeelding: JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLRead ✔ ✔ ✔ Indeling ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Algemeen document ✔ ✔ Vooraf gebouwd ✔ ✔ Aangepaste extractie ✔ ✔ Aangepaste classificatie ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.
Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en
4
MB voor gratis (F0).De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.
Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.
De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met punttekst
8
op 150 punten per inch (DPI).Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.
Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en
1
GB voor het neurale model.Voor het trainen van aangepast classificatiemodel is
1
de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's. Voor 2024-07-31-preview en hoger is2
de totale grootte van trainingsgegevens GB met maximaal 10.000 pagina's.
Ondersteunde talen en landinstellingen
Zie onze pagina voor vooraf samengestelde modeltaalondersteuning voor een volledige lijst met ondersteunde talen.
Veldextracties
Raadpleeg de schemapagina van het bankcontrolemodel in onze GitHub-voorbeeldopslagplaats voor ondersteunde velden voor documentextractie.
Ondersteunde landinstellingen
De prebuilt-bankStatement.us versie 2027-07-31-preview ondersteunt de landinstelling en-us .
Volgende stappen
Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio
Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.