Krav og begrensninger for ustrukturert dokumentbehandling i SharePoint
Tabellen nedenfor beskriver viktige faktorer du bør vurdere når du planlegger å bruke en ustrukturert dokumentbehandlingsmodell.
Ikon | Beskrivelse |
---|---|
![]() |
Filtyper som støttes Denne modellen støtter følgende filtyper: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls og .xlsx (formler i .xls og .xlsx filer kjøres ikke). |
![]() |
Språk som støttes Denne modellen støtter alle latinbaserte språk, inkludert: engelsk, fransk, tysk, italiensk og spansk. |
![]() |
OCR-vurderinger Denne modellen bruker OCR-teknologi (optical character recognition) til å skanne .pdf filer, bildefiler og .tiff filer. OCR-behandling fungerer best på dokumenter som oppfyller følgende krav: - Filformat for .jpg, .png eller .pdf (tekst eller skannet). Tekstbygde .pdf filer er bedre, fordi det ikke vil være noen feil i tegnutpakking og plassering. – Hvis .pdf filene er låst med passord, må du fjerne låsen før du sender dem inn. – Den kombinerte filstørrelsen for dokumentene som brukes til opplæring per samling, må ikke overskride 50 MB, og PDF-dokumenter bør ikke ha mer enn 500 sider. – For bilder må dimensjonene være mellom 50 x 50 og 10 000 x 10 000 piksler. Bilder som er svært brede eller har ulike dimensjoner (for eksempel plantegninger), kan bli avkortet i OCR-prosessen og miste nøyaktigheten. – For .pdf filer må dimensjonene være maksimalt 11 x 17 tommer, tilsvarende juridiske papirstørrelser eller A3-papirstørrelser og mindre. - Hvis skanninger skannes fra papirdokumenter, skal skanninger være bilder av høy kvalitet. - Må bruke det latinske alfabetet (engelske tegn). Legg merke til følgende forskjeller om tekstbaserte filer i Microsoft Office og OCR-skannede filer (.pdf, bilde eller .tiff): – Alle filer: Avkortet med 64 000 tegn (i opplæring og når de kjøres mot filer i et dokumentbibliotek). - OCR-skannede filer: Det er en grense på 500 sider. Bare PDF- og bildefiltyper behandles av OCR. |
![]() |
Multi-Geo-miljøer Når du konfigurerer Syntex i et Microsoft 365 Multi-Geo-miljø , kan du bare konfigurere den til å bruke modelltypen på den sentrale plasseringen. Hvis du vil bruke denne modelltypen på en satellittplassering, kontakter du Microsoft Kundestøtte. |
![]() |
Biblioteker med flere modeller Hvis to eller flere opplærte modeller brukes på samme bibliotek, klassifiseres filen ved hjelp av modellen som har høyest gjennomsnittlig konfidenspoengsum. De utpakkede enhetene er bare fra den brukte modellen. |