Exigences et limitations pour le traitement de documents prédéfinis dans SharePoint

Article
01/23/2025

Les sections suivantes décrivent les facteurs clés à prendre en compte lors de la planification de l’utilisation d’un modèle de traitement de document prédéfini.

Traitement des contrats

Icône	Description
	Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
	Langues prises en charge Ce modèle prend uniquement en charge les contrats en anglais.
	Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins.
	Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
	Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement des factures

Icône	Description
	Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
	Langues prises en charge Ce modèle prend en charge les factures en anglais, espagnol, allemand, français, italien, portugais et néerlandais.
	Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins.
	Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
	Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement des reçus

Icône	Description
	Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
	Langues prises en charge Ce modèle prend en charge les reçus en anglais, croate, tchèque, danois, néerlandais, finnois, allemand, hongrois, italien, japonais, letton, lituanien, norvégien, portugais, espagnol, suédois et vietnamien.
	Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins.
	Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
	Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement des informations sensibles

Icône	Description
	Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls et .xlsx.
	Langues prises en charge Ce modèle prend en charge les langues suivantes : consultez langues prises en charge. Ce modèle prend également en charge les langues du texte manuscrit et du texte imprimé.
	Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins. Prend en charge les langues pour le texte manuscrit et le texte imprimé.
	Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
	Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement de document simple

Icône	Description
	Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
	Langues prises en charge Ce modèle prend en charge les documents dans plus de 100 langues.
	Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins.
	Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
	Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.