Freigeben über


Anforderungen und Einschränkungen für die vordefinierte Dokumentverarbeitung in SharePoint

In den folgenden Abschnitten werden die wichtigsten Faktoren beschrieben, die bei der Planung der Verwendung eines vordefinierten Dokumentverarbeitungsmodells zu berücksichtigen sind.

Vertragsverarbeitung

Symbol Beschreibung
Symbol Unterstützte Dateitypen
Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
Unterhaltungssymbol. Unterstützte Sprachen
Dieses Modell unterstützt nur englischsprachige Verträge.
Absatzsymbol. OCR-Überlegungen
Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen:
- Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt.
- Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden.
- Die Dateigröße muss kleiner als 50 MB sein.
- Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen.
- Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner.
– Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
Globussymbol. Multi-Geo-Umgebungen
Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
Objektsymbol. Bibliotheken mit mehreren Modellen
Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Rechnungsverarbeitung

Symbol Beschreibung
Symbol Unterstützte Dateitypen
Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
Unterhaltungssymbol. Unterstützte Sprachen
Dieses Modell unterstützt Rechnungen in Englisch, Spanisch, Deutsch, Französisch, Italienisch, Portugiesisch und Niederländisch.
Absatzsymbol. OCR-Überlegungen
Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen:
- Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt.
- Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden.
- Die Dateigröße muss kleiner als 50 MB sein.
- Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen.
- Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner.
– Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
Globussymbol. Multi-Geo-Umgebungen
Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
Objektsymbol. Bibliotheken mit mehreren Modellen
Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Belegverarbeitung

Symbol Beschreibung
Symbol Unterstützte Dateitypen
Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
Unterhaltungssymbol. Unterstützte Sprachen
Dieses Modell unterstützt Belege in Englisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Finnisch, Deutsch, Ungarisch, Italienisch, Japanisch, Lettisch, Litauisch, Norwegisch, Portugiesisch, Spanisch, Schwedisch und Vietnamesisch.
Absatzsymbol. OCR-Überlegungen
Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen:
- Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt.
- Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden.
- Die Dateigröße muss kleiner als 50 MB sein.
- Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen.
- Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner.
– Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
Globussymbol. Multi-Geo-Umgebungen
Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
Objektsymbol. Bibliotheken mit mehreren Modellen
Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Verarbeitung vertraulicher Informationen

Symbol Beschreibung
Symbol Unterstützte Dateitypen
Dieses Modell unterstützt die folgenden Dateitypen: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls und .xlsx.
Unterhaltungssymbol. Unterstützte Sprachen
Dieses Modell unterstützt die folgenden Sprachen: Weitere Informationen finden Sie unter Unterstützte Sprachen.
Dieses Modell unterstützt auch Sprachen sowohl für handschriftlichen Text als auch für Drucktext.
Absatzsymbol. OCR-Überlegungen
Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen:
- Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt.
- Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden.
- Die Dateigröße muss kleiner als 50 MB sein.
- Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen.
- Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner.
– Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
Unterstützt Sprachen sowohl für handschriftlichen Text als auch für Drucktext.
Globussymbol. Multi-Geo-Umgebungen
Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
Objektsymbol. Bibliotheken mit mehreren Modellen
Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.

Einfache Dokumentverarbeitung

Symbol Beschreibung
Symbol Unterstützte Dateitypen
Dieses Modell unterstützt die folgenden Dateitypen: .bmp, .jpeg, .pdf, .png und .tiff.
Unterhaltungssymbol. Unterstützte Sprachen
Dieses Modell unterstützt Dokumente in mehr als 100 Sprachen.
Absatzsymbol. OCR-Überlegungen
Dieses Modell verwendet ocr-Technologie (Optische Zeichenerkennung), um .pdf Dateien, Bilddateien und .tiff Dateien zu scannen. Die OCR-Verarbeitung funktioniert am besten bei Dokumenten, die die folgenden Kriterien erfüllen:
- Dateiformat von .jpg, .png oder .pdf (Text oder gescannt). Text eingebettete .pdf-Dateien sind besser, da es keine Fehler bei der Zeichenextraktion und dem Speicherort gibt.
- Für .pdf und .tiff Dateien können bis zu 2.000 Seiten verarbeitet werden.
- Die Dateigröße muss kleiner als 50 MB sein.
- Bei Bildern müssen die Abmessungen zwischen 50 x 50 und 10.000 x 10.000 Pixeln betragen.
- Für .pdf Dateien müssen die Abmessungen höchstens 11 x 17 Zoll betragen, entsprechend den Papierformaten Legal oder A3 und kleiner.
– Die Gesamtgröße der Trainingsdaten beträgt maximal 500 Seiten.
Globussymbol. Multi-Geo-Umgebungen
Beim Einrichten von Syntex in einer Microsoft 365 Multi-Geo-Umgebung können Sie es nur so konfigurieren, dass der Modelltyp am zentralen Standort verwendet wird. Wenn Sie diesen Modelltyp an einem Satellitenstandort verwenden möchten, wenden Sie sich an den Microsoft-Support.
Objektsymbol. Bibliotheken mit mehreren Modellen
Wenn zwei oder mehr trainierte Modelle auf dieselbe Bibliothek angewendet werden, wird die Datei mithilfe des Modells klassifiziert, das die höchste durchschnittliche Zuverlässigkeitsbewertung aufweist. Die extrahierten Entitäten stammen nur aus dem angewendeten Modell.