Delen via


Vereisten en beperkingen voor vooraf gemaakte documentverwerking in SharePoint

In de volgende secties worden belangrijke factoren beschreven die u moet overwegen bij het plannen van een vooraf samengesteld documentverwerkingsmodel.

Contractverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt alleen Engelse contracten.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Factuurverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt facturen in het Engels, Spaans, Duits, Frans, Italiaans, Portugees en Nederlands.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Ontvangstbevestiging verwerken

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt ontvangstbewijzen in het Engels, Kroatisch, Tsjechisch, Deens, Nederlands, Fins, Duits, Hongaars, Italiaans, Japans, Lets, Litouws, Noors, Portugees, Spaans, Zweeds en Vietnamees.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Verwerking van gevoelige informatie

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls en .xlsx.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt de volgende talen: zie ondersteunde talen.
Dit model ondersteunt ook talen voor zowel handgeschreven tekst als afdruktekst.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Ondersteunt talen voor zowel handgeschreven tekst als afdruktekst.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.

Eenvoudige documentverwerking

Pictogram Omschrijving
Bestandensymbool. Ondersteunde bestandstypen
Dit model ondersteunt de volgende bestandstypen: .bmp, .jpeg, .pdf, .png en .tiff.
Gesprekssymbool. Ondersteunde talen
Dit model ondersteunt documenten in meer dan 100 talen.
Alineasymbool. OCR-overwegingen
Dit model maakt gebruik van OCR-technologie (Optical Character Recognition) om .pdf bestanden, afbeeldingsbestanden en .tiff bestanden te scannen. OCR-verwerking werkt het beste met documenten die aan de volgende vereisten voldoen:
- Bestandsindeling van .jpg, .png of .pdf (tekst of gescand). In tekst ingesloten .pdf bestanden zijn beter, omdat er geen fouten optreden bij het extraheren van tekens en de locatie.
- Voor .pdf en .tiff bestanden kunnen maximaal 2000 pagina's worden verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB.
- Voor afbeeldingen moeten afmetingen tussen 50 x 50 en 10.000 x 10.000 pixels zijn.
- Voor .pdf bestanden moeten de afmetingen maximaal 11 x 17 inch zijn, overeenkomend met legale of A3 papierformaten en kleiner.
- De totale grootte van de trainingsgegevens is 500 pagina's of minder.
Symbool van de wereldbol. Multi-geo-omgevingen
Wanneer u Syntex instelt in een Microsoft 365 Multi-Geo-omgeving , kunt u deze alleen configureren voor het gebruik van het modeltype op de centrale locatie. Als u dit modeltype op een satellietlocatie wilt gebruiken, neemt u contact op met Microsoft-ondersteuning.
Objectensymbool. Bibliotheken met meerdere modellen
Als twee of meer getrainde modellen worden toegepast op dezelfde bibliotheek, wordt het bestand geclassificeerd met het model met de hoogste gemiddelde betrouwbaarheidsscore. De geëxtraheerde entiteiten zijn alleen afkomstig van het toegepaste model.