Exigences et limitations des modèles dans Microsoft Syntex
S’applique à : ✓ Tous les modèles personnalisés | ✓ Tous les modèles prédéfinis
Microsoft Syntex vous permet de créer des modèles personnalisés et des modèles prédéfinis. Selon le type de modèle que vous choisissez, il peut y avoir différentes exigences, telles que le type et la taille de fichier, les langues qui doivent être prises en charge, les considérations géographiques et d’autres facteurs qui vous aideront à choisir le type de modèle à utiliser.
Modèles personnalisés :
- Traitement de documents non structurés
- Traitement de documents en forme libre
- Traitement de document structuré
Modèles prédéfinis :
- Traitement des contrats
- Traitement des factures
- Traitement des reçus
- Traitement des informations sensibles
- Traitement de document simple
Modèles personnalisés
Traitement de documents non structurés
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls et .xlsx (les formules dans les fichiers .xls et .xlsx ne sont pas exécutées). |
|
Langues prises en charge Ce modèle prend en charge toutes les langues latines, notamment l’anglais, le français, l’allemand, l’italien et l’espagnol. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Si vos fichiers .pdf sont verrouillés par mot de passe, vous devez supprimer le verrou avant de les envoyer. - La taille de fichier combinée des documents utilisés pour l’entraînement par collection ne doit pas dépasser 50 Mo, et les documents PDF ne doivent pas avoir plus de 500 pages. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. Les images très larges ou ayant des dimensions spéciales (par exemple, des plans au sol) peuvent être tronquées dans le processus OCR et perdre en précision. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - S’ils sont numérisés à partir de documents papier, les numérisations doivent être des images de haute qualité. - Doit utiliser l’alphabet latin (caractères anglais). Notez les différences suivantes concernant les fichiers texte microsoft Office et les fichiers analysés par OCR (.pdf, image ou .tiff) : - Tous les fichiers : tronqués à 64 000 caractères (en cours d’apprentissage et lors de l’exécution sur les fichiers d’une bibliothèque de documents). - Fichiers analysés par OCR : il existe une limite de 500 pages. Seuls les types de fichiers PDF et image sont traités par OCR. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. |
Traitement de documents en forme libre
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : consultez Exigences relatives aux types de fichiers. |
|
Langues prises en charge Ce modèle prend en charge les langages suivants : consultez Modèle pour les documents généraux. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur les documents qui répondent à ces exigences. |
|
Conseils d’optimisation Si votre modèle ne fonctionne pas comme vous le souhaitez, essayez ces étapes pour améliorer les performances de votre modèle. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Environnements Power Platform personnalisés Si vous utilisez un environnement personnalisé (plutôt que l’environnement par défaut) pour le traitement de Power Platform, il existe des exigences de configuration supplémentaires. Pour plus d’informations, consultez Environnements Power Platform personnalisés. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. Vous ne pouvez avoir qu’une seule forme libre ou un modèle structuré par bibliothèque. |
Traitement de document structuré
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : consultez Exigences relatives aux types de fichiers. |
|
Langues prises en charge Ce modèle prend en charge les langages suivants : consultez Modèle pour les documents à modèle fixe. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur les documents qui répondent à ces exigences. |
|
Conseils d’optimisation Si votre modèle ne fonctionne pas comme vous le souhaitez, essayez ces étapes pour améliorer les performances de votre modèle. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Environnements Power Platform personnalisés Si vous utilisez un environnement personnalisé (plutôt que l’environnement par défaut) pour le traitement de Power Platform, il existe des exigences de configuration supplémentaires. Pour plus d’informations, consultez Environnements Power Platform personnalisés. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. Vous ne pouvez avoir qu’une seule forme libre ou un modèle structuré par bibliothèque. |
Modèles préconçus
Traitement des contrats
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff. |
|
Langues prises en charge Ce modèle prend uniquement en charge les contrats en anglais. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. |
Traitement des factures
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff. |
|
Langues prises en charge Ce modèle prend en charge les factures en anglais, espagnol, allemand, français, italien, portugais et néerlandais. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. |
Traitement des reçus
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff. |
|
Langues prises en charge Ce modèle prend en charge les reçus en anglais, croation, tchèque, danois, néerlandais, finnois, allemand, hongrois, italien, japonais, letton, lituanien, norvégien, portugais, espagnol, suédois et vietnamien. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. |
Traitement des informations sensibles
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls et .xlsx. |
|
Langues prises en charge Ce modèle prend en charge les langues suivantes : consultez langues prises en charge. Ce modèle prend également en charge les langues du texte manuscrit et du texte imprimé. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins. Prend en charge les langues pour le texte manuscrit et le texte imprimé. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. |
Traitement de document simple
Icône | Description |
---|---|
Types de fichiers pris en charge Ce modèle prend en charge les types de fichiers suivants : .bmp, .jpeg, .pdf, .png et .tiff. |
|
Langues prises en charge Ce modèle prend en charge les documents dans plus de 100 langues. |
|
Considérations relatives à la reconnaissance optique de caractères Ce modèle utilise la technologie de reconnaissance optique de caractères (OCR) pour analyser .pdf fichiers, fichiers image et fichiers .tiff. Le traitement OCR fonctionne mieux sur des documents respectant les conditions requises suivantes : - Format de fichier .jpg, .png ou .pdf (texte ou analysé). Les fichiers .pdf incorporés dans le texte sont préférables, car il n’y aura pas d’erreurs dans l’extraction et l’emplacement des caractères. - Pour les fichiers .pdf et .tiff, jusqu’à 2 000 pages peuvent être traitées. - La taille du fichier doit être inférieure à 50 Mo. - Pour les images, les dimensions doivent être comprises entre 50 x 50 et 10 000 x 10 000 pixels. - Pour les fichiers .pdf, les dimensions doivent être au maximum de 11 x 17 pouces, correspondant aux formats de papier Legal ou A3 et inférieures. - La taille totale des données d’apprentissage est de 500 pages ou moins. |
|
Microsoft 365 Multigéographie Lorsque vous configurez Syntex dans un environnement Microsoft 365 Multi-Geo , vous pouvez uniquement le configurer pour utiliser le type de modèle à l’emplacement central. Si vous souhaitez utiliser ce type de modèle dans un emplacement satellite, contactez le support Microsoft. |
|
Bibliothèques multimodèles Si plusieurs modèles entraînés sont appliqués à la même bibliothèque, le fichier est classé à l’aide du modèle qui a le score de confiance moyen le plus élevé. Les entités extraites proviennent uniquement du modèle appliqué. |