Wat is er nieuw in Azure AI Document Intelligence?
Deze inhoud is van toepassing op:v4.0 (GA)
v3.1 (GA) v3.0 (GA)
v2.1 (GA)
De Document Intelligence-service wordt doorlopend bijgewerkt. Maak een bladwijzer voor deze pagina om op de hoogte te blijven van releaseopmerkingen, functieverbeteringen en onze nieuwste documentatie.
Belangrijk
Preview-API-versies worden buiten gebruik gesteld zodra de GA-API is uitgebracht. De API-versie 2023-02-28-preview wordt buiten gebruik gesteld. Als u nog steeds de preview-API of de bijbehorende SDK-versies gebruikt, werkt u uw code bij om de meest recente API-versie 2024-11-30 (GA)
te targeten.
December 2024
Document Intelligence v4.0 programmeertaal-SDK's zijn nu algemeen beschikbaar (GA)!
De nieuwste clientbibliotheken zijn standaard ingesteld op de VERSIE 2024-11-30 REST API (GA) van de service.
Zie clientbibliotheken voor de volgende ondersteunde programmeertalen voor meer informatie:
November 2024
Document Intelligence REST API v4.0: 2024-11-30 REST API (GA) is nu algemeen beschikbaar (GA)! De v4.0 REST API bevat de volgende wijzigingen:
-
- Batch-API ondersteunt nu alle modellen, waaronder alle lees-, indelings-, vooraf gemaakte verticalen en aangepaste modellen.
- Batch-API ondersteunt de functie LIST, zodat gebruikers binnen de afgelopen zeven dagen batchtaken kunnen vermelden.
- Batch-API ondersteunt de functie DELETE om de batchtaak expliciet te verwijderen voor AVG- en privacynaleving.
- GetAnalyzeBatchResult ondersteunt resultId in reactie op LIST alle resultIds.
🆕 Doorzoekbare PDF. Het vooraf samengestelde leesmodel ondersteunt nu indelingen voor afbeeldingen (JPEG/JPG, PNG, BMP, TIFF, HEIF) en taaluitbreiding om Chinees, Japans en Koreaans voor PDF-uitvoer op te nemen.
-
- Aangepast classificatiemodel ondersteunt incrementele training. U kunt nieuwe voorbeelden toevoegen aan bestaande klassen of nieuwe klassen toevoegen door te verwijzen naar een bestaande classificatie.
- Met v4.0 splitst het aangepaste classificatiemodel geen documenten standaard tijdens de analyse. U moet de eigenschap splitMode expliciet instellen op automatisch om het oudere gedrag te behouden.
- Aangepast classificatiemodel ondersteunt nu 25.000 pagina's als nieuwe limiet voor trainingspagina's.
-
- Aangepast neuraal model ondersteunt nu handtekeningdetectie.
- Aangepaste neurale modellen ondersteunen betaalde training voor langere duur wanneer u een model moet trainen met een grotere gelabelde gegevensset. De eerste 20 trainingsuitvoeringen in een kalendermaand blijven gratis. Alle trainingsbewerkingen van meer dan 20 bevinden zich in de betaalde laag. Meer informatie over facturering.
Model van amerikaanse bankinstructie
- Us Bank Statement Model ondersteunt nu het ophalen van de tabel controleren.
-
- Ondersteunt extractie van handtekeningen van payer
-
- Hypotheekmodel ondersteunt nu handtekeningdetectie voor formulieren 1003, 1004, 1005 en het sluiten van openbaarmaking.
-
- Het ontvangstmodel ondersteunt nu meer velden, waaronder ReceiptType, Belastingtarief, CountryRegion, nettobedrag en beschrijving.
-
- Nieuwe vooraf gebouwde belastingmodellen toegevoegd voor 1095A, 1095C, 1099SSA en W4.
-
- Het antwoord analyseren wordt gedurende 24 uur opgeslagen vanaf het moment dat de bewerking is voltooid voor het ophalen. Voor scenario's waarin u het antwoord eerder wilt verwijderen, gebruikt u de API voor het analyseren van het antwoord verwijderen om het antwoord te verwijderen.
De v4.0-API bevat cumulatieve updates van preview-releases zoals vermeld:
Augustus 2024
De DOCUMENT Intelligence 2024-07-31-preview REST API is nu beschikbaar. Deze preview-API introduceert nieuwe en bijgewerkte mogelijkheden:
Openbare preview-versie 2024-07-31-preview is momenteel alleen beschikbaar in de volgende Azure-regio's. Het nieuwe model voor documentveldextractie in azure AI Foundry Portal is alleen beschikbaar in de regio VS - noord-centraal:
VS - oost
VS - west 2
Europa -west
VS - noord-centraal
🆕 Model opstellen met aangepaste classificaties
- Document Intelligence voegt nu ondersteuning toe voor het opstellen van een model met een expliciet aangepast classificatiemodel. Meer informatie over de voordelen van het gebruik van de nieuwe opstelmogelijkheid.
-
- Aangepast classificatiemodel biedt nu ook ondersteuning voor het bijwerken van het model in-place.
- Aangepast classificatiemodel voegt ondersteuning toe voor het kopiëren van modellen om back-ups en herstel na noodgevallen in te schakelen.
- Aangepast classificatiemodel biedt nu ondersteuning voor het expliciet opgeven van pagina's die moeten worden geclassificeerd vanuit een invoerdocument.
-
- Informatie extraheren uit beoordeling (formulier 1004).
- Gegevens extraheren uit validatie van werk (formulier 1005).
-
- Pak de betaler, het bedrag, de datum en andere relevante informatie uit de controles uit.
-
- Nieuwe vooraf samengestelde betalings-stubs verwerken om lonen, uren, aftrek, nettoloon en meer te extraheren.
-
- Nieuwe vooraf samengestelde accountgegevens, waaronder begin- en eindsaldi, transactiegegevens uit bankafschriften.
-
- Nieuw geïntegreerd Amerikaans belastingmodel dat kan worden geëxtraheerd uit formulieren zoals W-2, 1098, 1099 en 1040.
🆕 Doorzoekbare PDF. Het vooraf samengestelde leesmodel ondersteunt nu PDF-uitvoer om PDF-bestanden te downloaden met ingesloten tekst uit extractieresultaten, zodat PDF kan worden gebruikt in scenario's zoals een zoekkopie van de inhoud.
Indelingsmodel ondersteunt nu verbeterde afbeeldingsdetectie waarbij afbeeldingen uit documenten nu kunnen worden gedownload als afbeeldingsbestand dat moet worden gebruikt voor meer begrip van afbeeldingen. Het indelingsmodel bevat ook verbeteringen in het OCR-model voor gescande tekst gericht op verbeteringen voor enkele tekens, tekstvakken en documenten met dichte tekst.
-
- Document Intelligence voegt nu ondersteuning toe voor batchanalysebewerkingen ter ondersteuning van het analyseren van een set documenten om de ervaring van ontwikkelaars te vereenvoudigen en de efficiëntie te verbeteren.
Mogelijkheden voor invoegtoepassingen
- Queryvelden AI-kwaliteit van extractie wordt verbeterd met het nieuwste model.
Mei 2024
Document Intelligence Studio voegt ondersteuning toe voor Microsoft Entra-verificatie (voorheen Azure Active Directory). ZieVerificatie in Document Intelligence Studio voor meer informatie.
Februari 2024
De DOCUMENT Intelligence 2024-07-31-preview REST API is nu beschikbaar. Deze preview-API introduceert nieuwe en bijgewerkte mogelijkheden:
Openbare preview-versie 2024-07-31-preview is momenteel alleen beschikbaar in de volgende Azure-regio's:
- VS - oost
- VS - west 2
- Europa -west
Indelingsmodel ondersteunt nu afbeeldingsdetectie en hiërarchische documentstructuuranalyse (secties en subsecties). De AI-kwaliteit van leesvolgorde en de detectie van logische rollen wordt ook verbeterd.
-
- Aangepaste extractiemodellen ondersteunen nu betrouwbaarheidsscores op cel-, rij- en tabelniveau. Meer informatie over betrouwbaarheid van tabellen, rijen en cellen.
- Aangepaste extractiemodellen hebben AI-kwaliteitsverbeteringen voor veldextractie.
- Aangepast sjabloonextractiemodel ondersteunt nu het extraheren van overlappende velden. Meer informatie over overlappende velden en hoe u deze gebruikt.
-
- Aangepast classificatiemodel biedt nu ondersteuning voor incrementele training voor scenario's waarin u het classificatiemodel moet bijwerken met toegevoegde voorbeelden of klassen. Meer informatie over incrementele training.
- Aangepast classificatiemodel voegt ondersteuning toe voor Office-documenttypen (.docx, .pptx en .xls). Meer informatie over uitgebreide ondersteuning voor documenttypen.
-
- Ondersteuning voor nieuwe landinstellingen:
Landinstelling Code Arabisch ( ar
)Bulgaars ( bg
)Grieks ( el
)Hebreeuws ( he
)Macedonisch ( mk
)Russisch ( ru
)Servisch Cyrillisch ( sr-cyrl
)Oekraïens ( uk
)Thai ( th
)Turks ( tr
)Vietnamees ( vi
)- Ondersteuning voor nieuwe valutacodes:
Valuta Landinstelling Code BAM
Bosnische converteerbare mark ( ba
)BGN
Bulgaarse Lev ( bg
)ILS
Israëlische nieuwe shekel ( il
)MKD
Macedonisch Denar ( mk
)RUB
Russische roebel ( ru
)THB
Thaise baht ( th
)TRY
Turkse lira ( tr
)UAH
Oekraïense Hryvnia ( ua
)VND
Vietnamese Dong ( vn
)- Uitbreiding van belastingartikelen voor Duitsland (), Spanje (
de
es
), Portugal (pt
), Engels Canadaen-CA
.
-
- Uitgebreide veldondersteuning voor id's en rijbewijs van de Europese Unie.
-
- Informatie extraheren uit de aanvraag voor een uniforme woonlening (formulier 1003).
- Gegevens extraheren uit Uniform Underwriting en Transmittal Summary of Form 1008.
- Informatie extraheren uit de openbaarmaking van hypotheekafsluiting.
-
- Gegevens extraheren uit bankkaarten.
-
- Nieuwe vooraf samengestelde gegevens uit huwelijkscertificaten extraheren.
December 2023
De Document Intelligence-clientbibliotheken gericht op REST API 2023-10-31-preview zijn nu beschikbaar voor gebruik.
November 2023
De REST API Document Intelligence 2023-10-31-preview is nu beschikbaar. Deze preview-API introduceert nieuwe en bijgewerkte mogelijkheden:
Openbare preview-versie 2023-10-31-preview is momenteel alleen beschikbaar in de volgende Azure-regio's:
- VS - oost
- VS - west 2
- Europa -west
-
- Taaluitbreiding voor handschrift: Russisch(
ru
), Arabisch(ar
), Thai(th
). - Naleving van Cyber Executive Order (EO).
- Taaluitbreiding voor handschrift: Russisch(
-
- Ondersteuning voor Office- en HTML-bestanden.
- Ondersteuning voor Markdown-uitvoer.
- Verbeteringen in tabelextractie, leesvolgorde en sectiekopdetectie.
- Met documentinformatie 2023-10-31-preview wordt het algemene documentmodel (vooraf samengesteld-document) afgeschaft. Als u in de toekomst sleutel-waardeparen uit documenten wilt extraheren, gebruikt u het
prebuilt-layout
model waarvoor de optionele querytekenreeksparameterfeatures=keyValuePairs
is ingeschakeld.
-
- Extraheert nu valuta voor alle prijsgerelateerde velden.
Model van de zorgverzekeringskaart
- Nieuwe veldondersteuning voor Medicare en Medicaid informatie.
Amerikaanse belastingdocumentmodellen
- Nieuw belastingmodel 1099. Ondersteunt de basisvorm 1099 en de volgende variaties: A, B, C, CAP, DIV, G, H, INT, K, LS, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Ondersteuning voor
KVK
veld. - Ondersteuning voor
BPAY
veld. - Talrijke veldverfijningen.
- Ondersteuning voor
-
- Ondersteuning voor documenten in meerdere talen.
- Opties voor het splitsen van nieuwe pagina's: automatisch splitsen, altijd splitsen op pagina, geen splitsing.
Mogelijkheden voor invoegtoepassingen
-
Queryvelden zijn beschikbaar in de
2023-10-31-preview
release. - Mogelijkheden voor invoegtoepassingen zijn beschikbaar in alle modellen, met uitzondering van het leesmodel.
-
Queryvelden zijn beschikbaar in de
Notitie
Met de release van 2022-08-31 API voor algemene beschikbaarheid (GA) worden de bijbehorende preview-API's afgeschaft. Als u de API-versies 2021-09-30-preview, 2022-01-30-preview of 2022-06-30-preview-API-versies gebruikt, werkt u uw toepassingen bij om de API-versie 2022-08-31 te bereiken. Er zijn enkele kleine wijzigingen betrokken. Zie de migratiehandleiding voor meer informatie.
Juli 2023
Notitie
Form Recognizer is nu Azure AI Document Intelligence.
- Er zijn geen wijzigingen in prijzen.
- De namen Cognitive Services en Azure-app lied AI blijven worden gebruikt in Azure-facturering, kostenanalyse, prijslijst en prijs-API's.
- Er zijn geen belangrijke wijzigingen in API's (Application Programming Interfaces) of clientbibliotheken.
- Sommige platforms wachten nog steeds op de hernoemingsupdate. Alle vermeldingen van Form Recognizer of Document Intelligence in onze documentatie verwijzen naar dezelfde Azure-service.
Document Intelligence v3.1 (GA)
De Document Intelligence versie 3.1 API is nu algemeen beschikbaar (GA)! De API-versie komt overeen met 2023-07-31
.
De v3.1-API introduceert nieuwe en bijgewerkte mogelijkheden:
- Document Intelligence-API's zijn nu modulairer en bieden ondersteuning voor optionele functies. U kunt nu de uitvoer aanpassen zodat deze specifiek de functies bevat die u nodig hebt. Meer informatie over de optionele parameters.
- Api voor documentclassificatie voor het splitsen van één bestand in afzonderlijke documenten. Meer informatie over documentclassificatie.
- Vooraf samengesteld contractmodel.
- Vooraf samengesteld amerikaans belastingformulier 1098-model.
- Ondersteuning voor Office-bestandstypen met read-API.
- Streepjescodeherkenning in documenten.
- Mogelijkheid voor invoegtoepassing voor formuleherkenning.
- Mogelijkheid voor invoegtoepassing voor lettertypeherkenning.
- Ondersteuning voor documenten met hoge resolutie.
- Aangepaste neurale modellen vereisen nu één gelabeld voorbeeld om te trainen.
- Taaluitbreiding voor aangepaste neurale modellen. Train een neuraal model voor documenten in 30 talen. Zie taalondersteuning voor de volledige lijst met ondersteunde talen.
- 🆕 Vooraf samengesteld model voor de zorgverzekering.
- Vooraf gedefinieerde uitbreiding van landinstellingen voor het factuurmodel.
- Vooraf samengestelde bonmodeltaal en uitbreiding van landinstellingen met meer dan 100 ondersteunde talen.
- Vooraf samengesteld id-model ondersteunt nu Europese id's.
UX-updates voor Document Intelligence Studio
✔️ Opties voor analyseren
Document Intelligence biedt nu ondersteuning voor geavanceerdere analysemogelijkheden en de Studio maakt het mogelijk om eenvoudig één toegangspunt (knop Opties analyseren) te configureren voor het configureren van de mogelijkheden van de invoegtoepassing.
Afhankelijk van het scenario voor documentextractie configureert u het analysebereik, documentpaginabereik, optionele detectie- en premiumdetectiefuncties.
Notitie
Lettertypeextractie wordt niet gevisualiseerd in Document Intelligence Studio. U kunt echter de stijlensectie van de JSON-uitvoer controleren op de resultaten van de detectie van lettertypen.
✔️ Documenten automatisch labelen met vooraf gedefinieerde modellen of een van uw eigen modellen
Op de pagina voor labelen van aangepaste extractiemodellen kunt u uw documenten nu automatisch labelen met behulp van een vooraf samengestelde Document Intelligent Service-modellen of -modellen die u eerder hebt getraind.
Voor sommige documenten kunnen er dubbele labels zijn nadat automatisch label is uitgevoerd. Zorg ervoor dat u de labels wijzigt zodat er daarna geen dubbele labels op de labelpagina staan.
✔️ Tabellen automatisch labelen
Op de pagina voor labelen van aangepast extractiemodel kunt u de tabellen in het document nu automatisch labelen zonder dat u de tabellen handmatig hoeft te labelen.
✔️ Testbestanden rechtstreeks toevoegen aan uw trainingsgegevensset
Zodra u een aangepast extractiemodel hebt getraind, gebruikt u de testpagina om de kwaliteit van uw model te verbeteren door indien nodig testdocumenten naar de trainingsgegevensset te uploaden.
Als er een lage betrouwbaarheidsscore wordt geretourneerd voor sommige labels, controleert u of uw labels juist zijn. Zo niet, voeg ze toe aan de trainingsgegevensset en label deze opnieuw om de kwaliteit van het model te verbeteren.
✔️ Gebruik maken van de documentlijstopties en filters in aangepaste projecten
Gebruik de pagina voor het labelen van aangepaste extractiemodellen. U kunt nu eenvoudig door uw trainingsdocumenten navigeren door gebruik te maken van de functie zoeken, filteren en sorteren op.
Gebruik de rasterweergave om een voorbeeld van documenten te bekijken of gebruik de lijstweergave om gemakkelijker door de documenten te bladeren.
✔️ Project delen
- Deel eenvoudig aangepaste extractieprojecten. Zie Project delen met aangepaste modellen voor meer informatie.
mei 2023
Introductie van vernieuwde documentatie voor Build 2023
🆕 Document Intelligence Overview verbeterde navigatie, gestructureerde toegangspunten en verrijkte afbeeldingen.
🆕 Kies een Document Intelligence-model met richtlijnen voor het kiezen van de beste Document Intelligence-oplossing voor uw projecten en werkstromen.
April 2023
Aankondiging van de nieuwste openbare preview-versie van de Document Intelligence-clientbibliotheek
Document Intelligence REST API versie 2023-02-28-preview ondersteunt de openbare preview-releaseclientbibliotheken . Deze release bevat de volgende nieuwe functies en mogelijkheden die beschikbaar zijn voor .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) en Python-clientbibliotheken (3.3.0b.1):
Zie de releaseopmerkingen voor Document Intelligence SDK (openbare preview) en maart 2023 voor meer informatie
Maart 2023
Belangrijk
2023-02-28-preview
de mogelijkheden zijn momenteel alleen beschikbaar in de volgende regio's:
- Europa -west
- VS - west 2
- VS - oost
-
Aangepast classificatiemodel is een nieuwe mogelijkheid binnen Document Intelligence die begint met de
2023-02-28-preview
API. -
Queryvelden die zijn toegevoegd aan het model Algemeen document, gebruiken Azure OpenAI-modellen om specifieke velden uit documenten te extraheren. Probeer de functie Algemene documenten met queryvelden met behulp van Document Intelligence Studio. Queryvelden zijn momenteel alleen actief voor resources in de
East US
regio. -
Mogelijkheden voor invoegtoepassingen:
-
Lettertypeextractie wordt nu herkend met de
2023-02-28-preview
API. -
Formuleextractie wordt nu herkend met de
2023-02-28-preview
API. -
Extractie van hoge resolutie wordt nu herkend met de
2023-02-28-preview
API.
-
Lettertypeextractie wordt nu herkend met de
-
Updates voor aangepast extractiemodel:
- Aangepast neuraal model ondersteunt nu toegevoegde talen voor training en analyse. Train neurale modellen voor Nederlands, Frans, Duits, Italiaans en Spaans.
- Aangepast sjabloonmodel heeft nu een verbeterde mogelijkheid voor handtekeningdetectie.
-
Updates voor Document Intelligence Studio :
- Naast ondersteuning voor alle nieuwe functies, zoals classificatie- en queryvelden, maakt Studio nu het delen van projecten voor aangepaste modelprojecten mogelijk.
- Nieuwe model toevoegingen in gated preview: Vaccinatiekaarten, Contracten, US Tax 1098, US Tax 1098-E en US Tax 1098-T. Als u toegang tot beperkte preview-modellen wilt aanvragen, moet u het aanvraagformulier documentinformatie voor persoonlijke preview invullen en verzenden.
-
Updates voor ontvangstmodel:
- Het ontvangstbewijsmodel voegt ondersteuning toe voor thermische ontvangstbewijzen.
- Ontvangstbewijsmodel voegt nu taalondersteuning toe voor 18 talen en drie regionale talen (Engels, Frans, Portugees).
- Het ontvangstmodel ondersteunt
TaxDetails
nu extractie.
- Het indelingsmodel verbetert nu de tabelherkenning.
- Leesmodel voegt nu verbetering toe voor herkenning van tekens met één cijfer.
2023 februari
Selecteer Document Intelligence-containers voor v3.0 zijn nu beschikbaar voor gebruik.
Momenteel zijn Read v3.0 - en Layout v3.0-containers beschikbaar.
ZieDocument Intelligence-containers installeren en uitvoeren voor meer informatie.
Januari 2023
Vooraf samengesteld ontvangstbewijsmodel- ondersteunde talen toegevoegd. Het ontvangstbewijsmodel ondersteunt nu deze toegevoegde talen en landinstellingen
- Japans - Japan (ja-JP)
- Frans - Canada (fr-CA)
- Nederlands - Nederland (nl-NL)
- Engels - Verenigde Arabische Emiraten (en-AE)
- Portugees - Brazilië (pt-BR)
Vooraf samengesteld factuurmodel- ondersteunde talen toegevoegd. Het factuurmodel ondersteunt nu deze toegevoegde talen en landinstellingen
- Engels - Verenigde Staten (en-US), Australië (en-AU), Canada (en-CA), Verenigd Koninkrijk (en-UK), India (en-IN)
- Spaans - Spanje (es-ES)
- Frans - Frankrijk (fr-FR)
- Italiaans - Italië (it-IT)
- Portugees - Portugal (pt-PT)
- Nederlands - Nederland (nl-NL)
Vooraf samengesteld factuurmodel- toegevoegde velden die worden herkend. Het factuurmodel herkent nu deze toegevoegde velden
- Valutacode
- Betalingsopties
- Totale korting
- Belastingartikelen (alleen en-IN)
Vooraf samengesteld id-model- documenttypen toegevoegd die worden ondersteund. Het id-model ondersteunt nu deze toegevoegde documenttypen
- Amerikaanse militaire id
Tip
Alle updates van januari 2023 zijn beschikbaar met REST API-versie 2022-08-31 (GA).
Vooraf samengesteld ontvangstbewijsmodel: aanvullende taalondersteuning:
Het vooraf samengestelde ontvangstbewijsmodel voegt ondersteuning toe voor de volgende talen:
- Engels - Verenigde Arabische Emiraten (en-AE)
- Nederlands - Nederland (nl-NL)
- Frans - Canada (fr-CA)
- Duits - (de-DE)
- Italiaans - (it-IT)
- Japans - Japan (ja-JP)
- Portugees - Brazilië (pt-BR)
Vooraf samengesteld factuurmodel: aanvullende taalondersteuning en veldextractie
Het vooraf samengestelde factuurmodel voegt ondersteuning toe voor de volgende talen:
- Engels - Australië (en-AU), Canada (en-CA), Verenigd Koninkrijk (en-UK), India (en-IN)
- Portugees - Brazilië (pt-BR)
Het vooraf samengestelde factuurmodel voegt nu ondersteuning toe voor de volgende veldextracties:
- Valutacode
- Betalingsopties
- Totale korting
- Belastingartikelen (alleen en-IN)
Vooraf samengesteld id-documentmodel: aanvullende ondersteuning voor documenttypen
Het vooraf gemaakte id-documentmodel voegt nu ondersteuning toe voor de volgende documenttypen:
- Uitbreiding van rijbewijs met ondersteuning voor India, Canada, Verenigd Koninkrijk en Australië
- Amerikaanse militaire id-kaarten en documenten
- India-id-kaarten en -documenten (PAN en Aadhaar)
- Australië-id-kaarten en -documenten (fotokaart, sleutelpas-id)
- Canada-id-kaarten en -documenten (identificatiekaart, Maple-kaart)
- Id-kaarten en documenten van het Verenigd Koninkrijk (nationale/regionale identiteitskaart)
December 2022
Updates voor Document Intelligence Studio
De release van Document Intelligence Studio van december bevat de nieuwste updates voor Document Intelligence Studio. Er zijn aanzienlijke verbeteringen in de gebruikerservaring, met name met ondersteuning voor aangepaste modellabels.
Paginabereik. De Studio ondersteunt nu het analyseren van opgegeven pagina's uit een document.
Aangepaste modellabels:
Voer de Layout-API automatisch uit. U kunt ervoor kiezen om de Indelings-API automatisch uit te voeren voor alle documenten in uw blobopslag tijdens het installatieproces voor een aangepast model.
Zoeken. De Studio bevat nu zoekfunctionaliteit om woorden in een document te zoeken. Dankzij deze verbetering kunt u eenvoudiger navigeren tijdens het labelen.
Navigatie. U kunt labels selecteren om gelabelde woorden in een document te richten.
Automatisch tabellabels. Nadat u het tabelpictogram in een document hebt geselecteerd, kunt u ervoor kiezen om de geëxtraheerde tabel in de labelweergave automatisch te labelen.
Labelsubtypen en subtypen op het tweede niveau The Studio ondersteunt nu subtypen voor tabelkolommen, tabelrijen en subtypen op het tweede niveau voor typen zoals datums en getallen.
Het bouwen van aangepaste neurale modellen wordt nu ondersteund in de regio US Gov Virginia.
Preview-API-versies
2022-01-30-preview
en2021-09-30-preview
wordt buiten gebruik gesteld op 31 januari 2023. Werk bij naar de2022-08-31
API-versie om serviceonderbrekingen te voorkomen.
november 2022
-
Aankondiging van de nieuwste stabiele release van Azure AI Document Intelligence-bibliotheken
- Deze release bevat belangrijke wijzigingen en updates voor .NET-, Java-, JavaScript- en Python-clientbibliotheken. ZieAzure SDK DevBlog voor meer informatie.
- De belangrijkste verbeteringen zijn de introductie van twee nieuwe clients, de
DocumentAnalysisClient
en deDocumentModelAdministrationClient
.
Oktober 2022
Inhoud met versiebeheer van documentinformatie
Document Intelligence-documentatie wordt bijgewerkt om een versie-ervaring te presenteren. Nu kunt u ervoor kiezen om inhoud weer te geven die is gericht op de
v3.0 GA
ervaring of dev2.1 GA
ervaring. De v3.0-ervaring is de standaardinstelling.
Document Intelligence Studio-voorbeeldcode
- Voorbeeldcode voor de labelervaring van Document Intelligence Studio is nu beschikbaar op GitHub. Klanten kunnen Document Intelligence ontwikkelen en integreren in hun eigen UX of hun eigen nieuwe UX bouwen met behulp van de Voorbeeldcode van Document Intelligence Studio.
Taaluitbreiding
- Met de nieuwste preview-versie ondersteunen Document Intelligence's Read (OCR), Layout en Custom template modellen 134 nieuwe talen. Deze taaltoevoegingen zijn Grieks, Lets, Servisch, Thai, Oekraïens en Vietnamees, samen met verschillende Latijnse en Cyrillische talen. Document Intelligence heeft nu in totaal 299 ondersteunde talen in de meest recente ALGEMENE en nieuwe preview-versies. Raadpleeg de pagina's met ondersteunde talen om alle ondersteunde talen weer te geven.
- Gebruik de PARAMETER REST API
api-version=2022-06-30-preview
wanneer u de API of de bijbehorende SDK gebruikt om de nieuwe talen in uw toepassingen te ondersteunen.
Nieuw vooraf samengesteld contractmodel
- Een nieuwe vooraf samengestelde functie waarmee informatie wordt geëxtraheerd uit contracten zoals partijen, titel, contract-id, uitvoeringsdatum en meer. het contractenmodel is momenteel in preview en vraagt hier toegang aan.
Regio-uitbreiding voor het trainen van aangepaste neurale modellen
- Aangepaste neurale modellen trainen die nu worden ondersteund in toegevoegde regio's.
- VS - oost
- VS - oost 2
- US Gov - Arizona
- Aangepaste neurale modellen trainen die nu worden ondersteund in toegevoegde regio's.
September 2022
Notitie
Vanaf versie 4.0.0 wordt een nieuwe set clients geïntroduceerd om de nieuwste functies van de Document Intelligence-service toe te passen.
De ALGEMENE release van SDK-versie 4.0.0 bevat de volgende updates:
- Versie 4.0.0 GA (2022-09-08)
- Ondersteunt REST API v3.0- en v2.0-clients
Regio-uitbreiding voor het trainen van aangepaste neurale modellen wordt nu ondersteund in zes nieuwe regio's
- Australië - oost
- Central US
- Azië - oost
- Frankrijk - centraal
- Verenigd Koninkrijk Zuid
- VS - west 2
Zie aangepaste neurale modellen voor een volledige lijst met regio's waarin training wordt ondersteund.
Release van document Intelligence SDK-versie
4.0.0 GA
:- Document Intelligence-clientbibliotheken versie 4.0.0 (.NET/C#, Java, JavaScript) en versie 3.2.0 (Python) zijn algemeen beschikbaar en klaar voor gebruik in productietoepassingen!.
- Zie het SDK-overzicht voor meer informatie over Document Intelligence-clientbibliotheken.
- Werk uw toepassingen bij met behulp van de migratiehandleiding voor uw programmeertaal.
Augustus 2022
De release van de Document Intelligence SDK bètaversie van augustus 2022 bevat de volgende updates:
Versie 4.0.0-beta.5 (2022-08-09)
Document Intelligence v3.0 algemeen beschikbaar
- Document Intelligence REST API v3.0 is nu algemeen beschikbaar en klaar voor gebruik in productietoepassingen. Werk uw toepassingen bij met REST API-versie 2022-08-31.
Updates voor Document Intelligence Studio
- Volgende stappen. Op elke modelpagina heeft Studio nu een sectie met de volgende stappen. Gebruikers kunnen snel verwijzen naar voorbeeldcode, richtlijnen voor probleemoplossing en prijsinformatie.
- Aangepaste modellen. De Studio bevat nu de mogelijkheid om labels in aangepaste modelprojecten opnieuw te ordenen om de efficiëntie van labels te verbeteren.
- Aangepaste modellen kopiëren kan worden gekopieerd naar Document Intelligence-services vanuit Studio. Met deze bewerking kunt u een getraind model promoveren naar andere omgevingen en regio's.
- Documenten verwijderen. De Studio ondersteunt nu het verwijderen van documenten uit gelabelde gegevensset in aangepaste projecten.
Updates voor Document Intelligence-service
- vooraf gedefinieerde leesbewerkingen. Ocr-model lezen is nu ook beschikbaar in Document Intelligence met alinea's en taaldetectie als de twee nieuwe functies. Document Intelligence Read is gericht op geavanceerde documentscenario's die zijn afgestemd op de bredere mogelijkheden voor documentinformatie in Document intelligence.
- vooraf gedefinieerde indeling. Met het indelingsmodel worden alinea's geëxtraheerd en wordt aangegeven of de geëxtraheerde tekst een alinea, titel, sectiekop, voetnoot, paginakoptekst, paginavoettekst of paginanummer is.
- vooraf samengestelde factuur. De velden TotalVAT en Regel/BTW worden nu omgezet in respectievelijk de bestaande velden TotalTax en Regel/Belasting.
- vooraf samengesteld-idDocument. Ondersteuning voor gegevensextractie voor amerikaanse staats-id's, sociale zekerheid en groene kaarten. Ondersteuning voor paspoortvisuminformatie.
- vooraf gemaakte ontvangstbewijs. Uitgebreide landinstellingenondersteuning voor Frans (fr-FR), Spaans (es-ES), Portugees (pt-PT), Italiaans (it-IT) en Duits (de-DE).
- vooraf samengestelde businessCard. Adresparse-ondersteuning voor het extraheren van subvelden voor adresonderdelen zoals adres, plaats, provincie, land/regio en postcode.
Verbeteringen in AI-kwaliteit
- vooraf gedefinieerde leesbewerkingen. Verbeterde ondersteuning voor enkele tekens, handgeschreven datums, bedragen, namen, andere belangrijke gegevens die vaak worden gevonden in ontvangstbewijzen en facturen en verbeterde verwerking van digitale PDF-documenten.
- vooraf gedefinieerde indeling. Ondersteuning voor een betere detectie van bijgesneden tabellen, randloze tabellen en verbeterde herkenning van langlopende cellen.
- vooraf samengesteld document. Verbeterde waarde- en selectievakjedetectie.
- custom-neurale. Verbeterde nauwkeurigheid voor tabeldetectie en -extractie.
Juni 2022
- De release van de Document Intelligence SDK-bètaversie van juni 2022 bevat de volgende updates:
Versie 4.0.0-beta.4 (2022-06-08)
De release van Document Intelligence Studio juni is de meest recente update van Document Intelligence Studio. Deze update bevat aanzienlijke gebruikerservaring en toegankelijkheidsverbeteringen:
- Codevoorbeeld voor JavaScript en C#. Op het tabblad Code van Studio worden nu naast de bestaande Python-codevoorbeelden JavaScript en C#-code toegevoegd.
- Nieuwe gebruikersinterface voor het uploaden van documenten. Studio biedt nu ondersteuning voor het uploaden van een document met slepen en neerzetten naar de nieuwe gebruikersinterface voor uploaden.
- Nieuwe functie voor aangepaste projecten. Aangepaste projecten bieden nu ondersteuning voor het maken van opslagaccounts en blobs bij het configureren van het project. Daarnaast biedt een aangepast project nu ondersteuning voor het uploaden van trainingsbestanden rechtstreeks in studio en het kopiëren van het bestaande aangepaste model.
Document Intelligence v3.0 2022-06-30-preview-release biedt uitgebreide updates voor de functie-API's:
- Indeling breidt structuurextractie uit. Indeling bevat nu toegevoegde structuurelementen, waaronder secties, sectiekoppen en alinea's. Met deze update worden gedetailleerdere scenario's voor documentsegmentatie mogelijk. Zie verbeterde structuur voor een volledige lijst met geïdentificeerdestructuurelementen.
- Ondersteuning voor aangepaste tabellaire velden voor neurale modellen. Aangepaste documentmodellen ondersteunen nu tabellaire velden. Tabellaire velden zijn standaard ook meerdere pagina's. Zie tabellaire velden voor meer informatie over tabellaire velden in aangepaste neurale modellen.
- Ondersteuning voor tabellaire velden voor aangepast sjabloonmodel voor tabellen op meerdere pagina's. Aangepaste formuliermodellen ondersteunen nu tabellaire velden op meerdere pagina's. Zie tabellaire velden voor meer informatie over tabellaire velden in aangepaste sjabloonmodellen.
- Uitvoer van factuurmodel bevat nu algemene sleutel-waardeparen voor documenten. Wanneer facturen vereiste velden bevatten buiten de velden die zijn opgenomen in het vooraf gedefinieerde model, vormt het algemene documentmodel een aanvulling op de uitvoer met sleutel-waardeparen. Ziesleutel-waardeparen.
- Uitbreiding van factuurtaal. Het factuurmodel bevat uitgebreide taalondersteuning. Zieondersteunde talen.
- Vooraf samengesteld visitekaartje bevat nu japanse taalondersteuning. Zieondersteunde talen.
- Vooraf samengesteld id-documentmodel. Het id-documentmodel extraheert nu DateOfIssue, Height, Weight, EyeColor, HairColor en DocumentDiscriminator uit de amerikaanse rijbewijslicenties. Zieveldextractie.
- Leesmodel ondersteunt nu veelgebruikte Microsoft Office-documenttypen. Documenttypen zoals Word (docx), Excel (xlsx) en PowerPoint (pptx) worden nu ondersteund met de Read-API. Zie Gegevensextractie lezen.
Februari 2022
Versie 4.0.0-beta.3 (2022-02-10)
In de preview-versie van Document Intelligence v3.0 worden verschillende nieuwe functies, mogelijkheden en verbeteringen geïntroduceerd:
- Aangepast neuraal model of aangepast documentmodel is een nieuw aangepast model voor het extraheren van tekst- en selectiemarkeringen uit gestructureerde formulieren, semi-gestructureerde en ongestructureerde documenten.
- Vooraf samengesteld W-2-model is een nieuw vooraf samengesteld model voor het extraheren van velden uit W-2-formulieren voor belastingrapportage- en inkomensverificatiescenario's.
- Lees-API extraheert gedrukte tekstregels, woorden, tekstlocaties, gedetecteerde talen en handgeschreven tekst, indien gedetecteerd.
- Het vooraf getrainde algemene documentmodel wordt nu bijgewerkt ter ondersteuning van selectiemarkeringen naast API-tekst, tabellen, structuur en sleutel-waardeparen uit formulieren en documenten.
- Het vooraf samengestelde factuurmodel voor de Factuur-API breidt de ondersteuning uit naar Spaanse facturen.
- Document Intelligence Studio voegt nieuwe demo's toe voor lees-, W2-, hotelbevestigingsvoorbeelden en ondersteuning voor het trainen van de nieuwe aangepaste neurale modellen.
- Taaluitbreiding documentinformatie lezen, indeling en aangepast formulier voegen ondersteuning toe voor 42 nieuwe talen, waaronder Arabisch, Hindi en andere talen die Arabische en Devanagari-scripts gebruiken om de dekking uit te breiden naar 164 talen. Handgeschreven taalondersteuning wordt uitgebreid naar Japans en Koreaans.
Aan de slag met de nieuwe v3.0 preview-API.
Gegevensextractie van documentinformatiemodel:
Model Tekstextractie Sleutel-waardeparen Selectiemarkeringen Tabellen Handtekeningen Read ✓ Algemeen document ✓ ✓ ✓ ✓ Indeling ✓ ✓ ✓ Factuur ✓ ✓ ✓ ✓ Ontvangstbewijs ✓ ✓ ✓ Id-document ✓ ✓ Visitekaartje ✓ ✓ Sjabloon Aangepast ✓ ✓ ✓ ✓ ✓ Aangepaste neurale ✓ ✓ ✓ ✓ De bètaversie van document Intelligence SDK bevat de volgende updates:
Aangepaste documentmodellen en -modi:
- Aangepaste sjabloon (voorheen aangepast formulier).
- Aangepast neuraal.
- Aangepast model: buildmodus.
Vooraf samengesteld W-2-model (prebuilt-tax.us.w2).
Vooraf samengesteld model lezen (vooraf gedefinieerd).
Vooraf samengesteld model voor facturen (Spaans) (vooraf samengestelde factuur).
Volgende stappen
Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.
Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.
Probeer uw eigen formulieren en documenten te verwerken met het hulpprogramma Document Intelligence Sample Labeling.
Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.