Partager via


Exigences et limitations pour le traitement de documents prédéfinis dans SharePoint

Les sections suivantes décrivent les facteurs clés à prendre en compte lors de la planification de l’utilisation d’un modèle de traitement de document prédéfini.

Traitement des contrats

Icône Description
Symbole de fichiers. Types de fichiers pris en charge
Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
Symbole de conversation. Langues prises en charge
Ce modèle prend uniquement en charge les contrats en anglais.
Symbole de paragraphe. Considérations relatives à la reconnaissance optique de caractères
Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes :
- Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères.
- Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées.
- La taille du fichier doit être inférieure à 50 Mo.
- Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
- Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures.
- La taille totale des données d’apprentissage est de 500 pages ou moins.
Symbole de globe. Microsoft 365 Multigéographie
Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
Symbole d’objets. Bibliothèques multimodèles
Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement des factures

Icône Description
Symbole de fichiers. Types de fichiers pris en charge
Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
Symbole de conversation. Langues prises en charge
Ce modèle prend en charge les factures en anglais, espagnol, allemand, français, italien, portugais et néerlandais.
Symbole de paragraphe. Considérations relatives à la reconnaissance optique de caractères
Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes :
- Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères.
- Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées.
- La taille du fichier doit être inférieure à 50 Mo.
- Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
- Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures.
- La taille totale des données d’apprentissage est de 500 pages ou moins.
Symbole de globe. Microsoft 365 Multigéographie
Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
Symbole d’objets. Bibliothèques multimodèles
Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement des reçus

Icône Description
Symbole de fichiers. Types de fichiers pris en charge
Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
Symbole de conversation. Langues prises en charge
Ce modèle prend en charge les reçus en anglais, croate, tchèque, danois, néerlandais, finnois, allemand, hongrois, italien, japonais, letton, lituanien, norvégien, portugais, espagnol, suédois et vietnamien.
Symbole de paragraphe. Considérations relatives à la reconnaissance optique de caractères
Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes :
- Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères.
- Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées.
- La taille du fichier doit être inférieure à 50 Mo.
- Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
- Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures.
- La taille totale des données d’apprentissage est de 500 pages ou moins.
Symbole de globe. Microsoft 365 Multigéographie
Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
Symbole d’objets. Bibliothèques multimodèles
Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement des informations sensibles

Icône Description
Symbole de fichiers. Types de fichiers pris en charge
Ce modèle prend en charge les types de fichiers suivants : .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls et .xlsx.
Symbole de conversation. Langues prises en charge
Ce modèle prend en charge les langues suivantes : consultez langues prises en charge.
Ce modèle prend également en charge les langues du texte manuscrit et du texte imprimé.
Symbole de paragraphe. Considérations relatives à la reconnaissance optique de caractères
Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes :
- Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères.
- Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées.
- La taille du fichier doit être inférieure à 50 Mo.
- Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
- Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures.
- La taille totale des données d’apprentissage est de 500 pages ou moins.
Prend en charge les langues pour le texte manuscrit et le texte imprimé.
Symbole de globe. Microsoft 365 Multigéographie
Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
Symbole d’objets. Bibliothèques multimodèles
Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.

Traitement de document simple

Icône Description
Symbole de fichiers. Types de fichiers pris en charge
Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff.
Symbole de conversation. Langues prises en charge
Ce modèle prend en charge les documents dans plus de 100 langues.
Symbole de paragraphe. Considérations relatives à la reconnaissance optique de caractères
Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes :
- Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères.
- Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées.
- La taille du fichier doit être inférieure à 50 Mo.
- Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels.
- Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures.
- La taille totale des données d’apprentissage est de 500 pages ou moins.
Symbole de globe. Microsoft 365 Multigéographie
Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft.
Symbole d’objets. Bibliothèques multimodèles
Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué.