Vereisten en beperkingen voor vooraf gemaakte documentverwerking in SharePoint

Artikel
01/23/2025

In de volgende secties worden belangrijke factoren beschreven die u moet overwegen bij het plannen van een vooraf samengesteld documentverwerkingsmodel.

Contractverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt alleen Engelse contracten.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Factuurverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt facturen in het Engels, Spaans, Duits, Frans, Italiaans, Portugees en Nederlands.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Ontvangstbevestiging verwerken

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt ontvangstbewijzen in het Engels, Kroatisch, Tsjechisch, Deens, Nederlands, Fins, Duits, Hongaars, Italiaans, Japans, Lets, Litouws, Noors, Portugees, Spaans, Zweeds en Vietnamees.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Verwerking van gevoelige informatie

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls en .xlsx.
	Ondersteunde talen Dit model ondersteunt de volgende talen: zie ondersteunde talen. Dit model ondersteunt ook talen voor zowel handgeschreven tekst als afdruktekst.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder. Ondersteunt talen voor zowel handgeschreven tekst als afdruktekst.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Eenvoudige documentverwerking

Pictogram	Omschrijving
	Ondersteunde bestandstypen Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
	Ondersteunde talen Dit model ondersteunt documenten in meer dan 100 talen.
	OCR-overwegingen Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen: - Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie. - Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt. - De bestandsgrootte moet kleiner zijn dan 50 MB. - Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn. - Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner. - De totale grootte van de trainingsgegevens is 500 pagina's of minder.
	Multi-geo-omgevingen Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
	Bibliotheken met meerdere modellen Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.