Anforderungen und Einschränkungen für die vordefinierte Dokumentverarbeitung in SharePoint

Artikel
01/23/2025

In den folgenden Abschnitten werden die wichtigsten Faktoren beschrieben, die bei der Planung der Verwendung eines vordefinierten Dokumentverarbeitungsmodells zu berücksichtigen sind.

Vertragsverarbeitung

Symbol	Beschreibung
	Unterstützte Dateitypen Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
	Unterstützte Sprachen Dieses Modell unterstützt nur englischsprachige Verträge.
	OCR-Überlegungen Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen: - Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt. - Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden. - Die Dateigröße muss kleiner als 50 MB sein. - Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen. - Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner. – Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
	Multi-Geo-Umgebungen Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
	Bibliotheken mit mehreren Modellen Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Rechnungsverarbeitung

Symbol	Beschreibung
	Unterstützte Dateitypen Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
	Unterstützte Sprachen Dieses Modell unterstützt Rechnungen in Englisch, Spanisch, Deutsch, Französisch, Italienisch, Portugiesisch und Niederländisch.
	OCR-Überlegungen Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen: - Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt. - Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden. - Die Dateigröße muss kleiner als 50 MB sein. - Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen. - Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner. – Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
	Multi-Geo-Umgebungen Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
	Bibliotheken mit mehreren Modellen Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Belegverarbeitung

Symbol	Beschreibung
	Unterstützte Dateitypen Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
	Unterstützte Sprachen Dieses Modell unterstützt Belege in Englisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Finnisch, Deutsch, Ungarisch, Italienisch, Japanisch, Lettisch, Litauisch, Norwegisch, Portugiesisch, Spanisch, Schwedisch und Vietnamesisch.
	OCR-Überlegungen Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen: - Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt. - Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden. - Die Dateigröße muss kleiner als 50 MB sein. - Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen. - Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner. – Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
	Multi-Geo-Umgebungen Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
	Bibliotheken mit mehreren Modellen Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Verarbeitung vertraulicher Informationen

Symbol	Beschreibung
	Unterstützte Dateitypen Dieses Modell unterstützt die folgenden Dateitypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls und .xlsx.
	Unterstützte Sprachen Dieses Modell unterstützt die folgenden Sprachen: Weitere Informationen finden Sie unter Unterstützte Sprachen. Dieses Modell unterstützt auch Sprachen sowohl für handschriftlichen Text als auch für Drucktext.
	OCR-Überlegungen Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen: - Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt. - Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden. - Die Dateigröße muss kleiner als 50 MB sein. - Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen. - Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner. – Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten. Unterstützt Sprachen sowohl für handschriftlichen Text als auch für Drucktext.
	Multi-Geo-Umgebungen Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
	Bibliotheken mit mehreren Modellen Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Einfache Dokumentverarbeitung

Symbol	Beschreibung
	Unterstützte Dateitypen Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
	Unterstützte Sprachen Dieses Modell unterstützt Dokumente in mehr als 100 Sprachen.
	OCR-Überlegungen Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen: - Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt. - Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden. - Die Dateigröße muss kleiner als 50 MB sein. - Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen. - Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner. – Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
	Multi-Geo-Umgebungen Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
	Bibliotheken mit mehreren Modellen Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.