Vooraf gedefinieerde modellen begrijpen

3 minuten

Met vooraf samengestelde modellen in Azure AI Document Intelligence kunt u gegevens extraheren uit algemene formulieren en documenten zonder uw eigen modellen te trainen.

In uw pollingbedrijf zijn pollingformulieren uniek voor elk enquêteproject, maar u gebruikt ook facturen en ontvangsten om financiële transacties vast te leggen en u hebt veel ongestructureerde documenten. U wilt weten hoeveel werk er nodig is om namen, adressen, bedragen en andere informatie uit deze documenten te extraheren.

Hier leert u hoe u vooraf gemaakte modellen kunt gebruiken om algemene documenttypen te analyseren.

Wat zijn vooraf samengestelde modellen?

De algemene benadering die wordt gebruikt in AI-oplossingen is om een grote hoeveelheid voorbeeldgegevens te bieden en vervolgens een geoptimaliseerd model te trainen door verschillende gegevensfuncties, parameters en statistische behandelingen uit te proberen. De combinatie die het beste de waarden voorspelt die u interesseert, vormt het getrainde model en u kunt dit gebruiken om waarden van nieuwe gegevens te voorspellen.

Veel van de formulieren die bedrijven van dag tot dag gebruiken, zijn van een aantal veelvoorkomende typen. De meeste bedrijven geven bijvoorbeeld facturen en ontvangstbevestigingen uit of ontvangen ze. Elk bedrijf dat werknemers in de Verenigde Staten heeft, moet het formulier W-2 belastingaangifte gebruiken. Ook hebt u vaak meer algemene documenten waaruit u mogelijk gegevens wilt extraheren. Voor deze gevallen heeft Microsoft geholpen door het leveren van vooraf samengestelde modellen. Vooraf gemaakte modellen zijn al getraind op grote aantallen van hun doelformuliertype.

Als u Document Intelligence wilt gebruiken om gegevens te extraheren uit een van deze algemene formulieren of documenten, kunt u ervoor kiezen om een vooraf samengesteld model te gebruiken en u hoeft niet uw eigen model te trainen. Omdat Microsoft deze modellen heeft getraind op een groot aantal voorbeelden, kunt u verwachten dat ze nauwkeurige en betrouwbare resultaten leveren bij het verwerken van hun beoogde formulieren.

Verschillende van de vooraf gemaakte modellen worden getraind op specifieke formuliertypen:

Factuurmodel. Haalt algemene velden en de bijbehorende waarden op uit facturen.
Ontvangstbewijsmodel. Haalt algemene velden en de bijbehorende waarden op uit ontvangstbevestigingen.
Amerikaans belastingmodel. Geïntegreerd Amerikaans belastingmodel dat kan worden geëxtraheerd uit formulieren zoals W-2, 1098, 1099 en 1040.
Id-documentmodel. Haalt gemeenschappelijke velden en hun waarden op uit amerikaanse rijbewijs's, id's en rijbewijs van de Europese Unie, en internationale paspoorten.
Visitekaartjesmodel. Haalt algemene velden en de bijbehorende waarden op uit visitekaartjes.
Model van de zorgverzekeringskaart. Haalt algemene velden en hun waarden op uit de zorgverzekeringskaarten.
Huwelijksakte. Extraheert informatie uit huwelijkscertificaten.
Creditcard-/debitcardmodel. Haalt algemene informatie op uit bankkaarten.
Hypotheekdocumenten. Extraheert informatie uit de openbaarmaking van hypotheeksluiting, Uniform Residential Loan Application (Formulier 1003), Beoordeling (Formulier 1004), Validatie van Werkgelegenheid (Formulier 1005) en Uniform Underwriting and Transmittal Summary (formulier 1008).
Bankinstructiemodel. Extraheert rekeninggegevens, waaronder begin- en eindsaldi, transactiegegevens uit bankafschriften.
Stub-model betalen. Extraheert lonen, uren, aftrek, nettoloon en andere gemeenschappelijke loon-stubvelden.
Controleer het model. Extraheert de betabetale, het bedrag, de datum en andere relevante informatie uit de controles.

De andere modellen zijn ontworpen om waarden te extraheren uit documenten met minder specifieke structuren:

Model lezen. Hiermee worden tekst en talen uit documenten geëxtraheerd.
Algemeen documentmodel. Tekst, sleutels, waarden, entiteiten en selectiemarkeringen extraheren uit documenten.
Indelingsmodel. Hiermee worden tekst- en structuurgegevens uit documenten geëxtraheerd.

Functies van vooraf samengestelde modellen

De vooraf gemaakte modellen zijn ontworpen om verschillende typen gegevens te extraheren uit de documenten en formulieren die gebruikers indienen. Als u het juiste model voor uw vereisten wilt selecteren, moet u deze functies begrijpen:

Tekstextractie. Alle vooraf samengestelde modellen extraheren regels tekst en woorden uit handgeschreven en afgedrukte tekst.
Sleutel-waardeparen. Tekstbereiken in een document waarmee een label of sleutel en de bijbehorende reactie of waarde worden geëxtraheerd door veel modellen als sleutel-waardenparen. Een typische sleutel kan bijvoorbeeld Gewicht zijn en de waarde ervan kan 31 kg zijn.
Entiteiten. Tekst die algemenere, complexere gegevensstructuren bevat, kunnen als entiteiten worden geëxtraheerd. Entiteitstypen omvatten personen, locaties en datums.
Selectiemarkeringen. Tekstbereiken die aangeven dat een keuze kan worden geëxtraheerd door sommige modellen als selectiemarkeringen. Deze markeringen omvatten keuzerondjes en selectievakjes.
Tabellen. Veel modellen kunnen tabellen in gescande formulieren extraheren uit de gegevens in cellen, het aantal kolommen en rijen en kolom- en rijkoppen. Tabellen met samengevoegde cellen worden ondersteund.
Velden. Modellen die zijn getraind voor een specifiek formuliertype identificeren de waarden van een vaste set velden. Het factuurmodel bevat bijvoorbeeld de velden CustomerName en InvoiceTotal .

Houd er ook rekening mee dat vooraf gemaakte modellen zijn ontworpen voor en getraind zijn op algemene document- en formuliertypen. Als u een branchespecifiek of uniek formuliertype hebt dat u vaak gebruikt, kunt u mogelijk betrouwbaardere en voorspelbare resultaten verkrijgen met behulp van een aangepast model. Het kost echter tijd om aangepaste modellen te ontwikkelen, omdat u de tijd en middelen moet investeren om ze te trainen op voorbeeldformulieren voordat u deze kunt gebruiken. Hoe groter het aantal voorbeeldformulieren dat u voor training opgeeft, hoe beter het model nauwkeurig is bij de inhoud van het voorspellingsformulier.

Vereisten voor invoer

De vooraf gemaakte modellen zijn zeer flexibel, maar u kunt ze helpen om nauwkeurige en nuttige resultaten te retourneren door één duidelijke foto of een hoge kwaliteit scan voor elk document in te dienen.

U moet ook aan deze vereisten voldoen wanneer u een formulier indient voor analyse:

Het bestand moet de INDELING JPEG, PNG, BMP, TIFF of PDF hebben. Daarnaast kan het leesmodel Microsoft Office-bestanden accepteren.
Het bestand moet kleiner zijn dan 500 MB voor de standard-laag en 4 MB voor de gratis laag.
Afbeeldingen moeten afmetingen hebben tussen 50 x 50 pixels en 10.000 x 10.000 pixels.
PDF-documenten moeten afmetingen hebben van minder dan 17 x 17 inch of A3 papierformaat.
PDF-documenten mogen niet worden beveiligd met een wachtwoord.

Notitie

Indien mogelijk kunt u ingesloten PDF-bestanden met tekst verzenden, omdat hiermee fouten in tekenherkenning worden voorkomen.

PDF- en TIFF-bestanden kunnen een willekeurig aantal pagina's hebben, maar in de standaardlaag worden alleen de eerste 2000 pagina's geanalyseerd. In de gratis laag worden alleen de eerste twee pagina's geanalyseerd.

Vooraf samengestelde modellen uitproberen met Azure AI Document Intelligence Studio

Azure AI Document Intelligence is ontworpen als een webservice die u kunt aanroepen met behulp van code in uw aangepaste toepassingen. Het is echter vaak handig om de modellen te verkennen en hoe ze zich visueel gedragen met uw formulieren. U kunt dergelijke experimenten uitvoeren met behulp van Azure AI Document Intelligence Studio en de ervaring gebruiken om uw code te ontwerpen en te schrijven.

U kunt een van de vooraf gemaakte modellen kiezen in Azure AI Document Intelligence Studio. Microsoft biedt enkele voorbeelddocumenten voor gebruik met elk model of u kunt uw eigen documenten toevoegen en analyseren.

Vooraf samengestelde modellen aanroepen met behulp van API's

Omdat Azure AI Document Intelligence RESTful-webservices implementeert, kunt u webservice-aanroepen gebruiken vanuit elke taal die deze ondersteunt. Wanneer u echter de Azure AI Document Intelligence-API's van Microsoft gebruikt, wordt beveiliging en sessiebeheer vereenvoudigd en moet u minder code schrijven.

API's zijn beschikbaar voor:

C# en andere .NET-talen.
Java.
Python.
JavaScript.

Wanneer u Azure AI Document Intelligence wilt aanroepen, moet u beginnen met het verbinden en verifiëren met de service in uw Azure-abonnement. Als u deze verbinding wilt maken, hebt u het volgende nodig:

Het service-eindpunt. Deze waarde is de URL waar de service wordt gepubliceerd.
De API-sleutel. Deze waarde is een unieke sleutel die toegang verleent.

U verkrijgt beide waarden uit Azure Portal.

Omdat het enkele seconden kan duren voordat de service reageert, kunt u het beste asynchrone aanroepen gebruiken om een formulier in te dienen en vervolgens resultaten te verkrijgen uit de analyse:

AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-layout", fileUri);

AnalyzeResult result = operation.Value;

poller = document_analysis_client.begin_analyze_document(
        "prebuilt-layout", AnalyzeDocumentRequest(url_source=docUrl
    ))
result: AnalyzeResult = poller.result()

De details die u uit deze resultaten kunt halen, zijn afhankelijk van het model dat u hebt gebruikt.