Krav och begränsningar för fördefinierad dokumentbearbetning i SharePoint

Artikel
01/23/2025

I följande avsnitt beskrivs viktiga faktorer att tänka på när du planerar att använda en fördefinierad modell för dokumentbearbetning.

Kontraktsbearbetning

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder endast engelskspråkiga kontrakt.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Bearbetning av faktura

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder fakturor på engelska, spanska, tyska, franska, italienska, portugisiska och nederländska.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Bearbetning av kvitto

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder kvitton på engelska, kroatiska, tjeckiska, danska, nederländska, finska, tyska, ungerska, italienska, japanska, lettiska, litauiska, norska, portugisiska, spanska, svenska och vietnamesiska.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Bearbetning av känslig information

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls och .xlsx.
	Språk som stöds Den här modellen stöder följande språk: se språk som stöds. Den här modellen stöder även språk för både handskriven text och utskriftstext.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre. Stöder språk för både handskriven text och utskriftstext.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.

Enkel dokumentbearbetning

Ikon	Beskrivning
	Filtyper som stöds Den här modellen stöder följande filtyper: .bmp, .jpeg, .pdf, .png och .tiff.
	Språk som stöds Den här modellen stöder dokument på fler än 100 språk.
	OCR-överväganden Den här modellen använder optisk teckenigenkänningsteknik (OCR) för att skanna .pdf filer, bildfiler och .tiff filer. OCR-bearbetningen fungerar bäst med dokument som uppfyller följande krav: – Filformat för .jpg, .png eller .pdf (text eller genomsökt). Text-inbäddade .pdf filer är bättre, eftersom det inte kommer att finnas några fel i extrahering och plats för tecken. - För .pdf och .tiff filer kan upp till 2 000 sidor bearbetas. – Filstorleken måste vara mindre än 50 MB. – För bilder måste måtten vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter. - För .pdf filer måste måtten vara högst 11 x 17 tum, motsvarande legala eller A3 pappersstorlekar och mindre. – Den totala storleken på träningsdata är 500 sidor eller mindre.
	Multi-Geo miljöer När du konfigurerar Syntex i en Microsoft 365 Multi-Geo-miljö kan du bara konfigurera den så att den använder modelltypen på den centrala platsen. Om du vill använda den här modelltypen på en satellitplats kontaktar du Microsofts support.
	Bibliotek med flera modeller Om två eller flera tränade modeller tillämpas på samma bibliotek klassificeras filen med den modell som har den högsta genomsnittliga konfidenspoängen. De extraherade entiteterna kommer endast från den tillämpade modellen.