Exigences et limitations pour un modèle de traitement de documents
Langues prises en charge
Modèle pour les documents à modèle fixe
Les langues suivantes sont prises en charge lors de la formation d’un modèle de traitement de documents et de la sélection de Documents à modèle fixe comme type de document :
Abaza, Abkhaze, Achinois, Acoli, Adangme, Adyghe, Afar, Afrikaans, Akan, Albanais, Algonquin, Angika (Devanagari), Arabe, Asturien, Asu (Tanzanie), Avaric, Awadhi-Hindi (Devanagari), Aymara, Azerbaïdjanais (Latin ), Bafia, Bagheli, Bambara, Bachkir, basque, biélorusse (cyrillique), biélorusse (latin), Bemba (Zambie), Bemba (Zambie), bhojpuri-hindi (devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), bosniaque (latin), brajbha, breton, bulgare, bundeli, bouriate (cyrillique), catalan, cebuano, chamling, chamorro, tchétchène, chhattisgarhi (devanagari), chiga, chinois simplifié, chinois traditionnel, choctaw, chukot, tchouvache, cornique, corse, Cri, Creek, Tatar de Crimée (latin), croate, corbeau, tchèque, danois, Dargwa, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dungan, néerlandais, Efik, anglais, Erzya (cyrillique), estonien, féroïen, fidjien, philippin, finnois, fon, français, frioulan, ga, gagaouze (latin), galicien, ganda, gayo, allemand, gilbertais, gondi (devanagari), grec, groenlandais, guarani, gurung (devanagari), gusii, haïtien Créole, Halbi (Devanagari), Hani, Haryanvi, hawaïen, hébreu, Herero, Hiligaynon, Hindi, Hmong Daw (latin), Ho (Devanagiri), hongrois, Iban, islandais, Igbo, Iloko, Inari Sami, indonésien, ingouche, interlingua, Inuktitut (latin), irlandais, italien, japonais, Jaunsari (Devanagari), javanais, Jola-Fonyi, Kabardien, Kabuverdianu, Kachin (latin), Kalenjin, Kalmyk, Kangri (Devanagari), Kanuri, Karachay-Balkar, Kara-Kalpak (cyrillique), Kara-Kalpak (latin), cachoube, kazakh (cyrillique), kazakh (latin), Khakas, Khaling, Khasi, K’iche’, Kikuyu, Kildin Sami, Kinyarwanda, Komi, Kongo, coréen, Korku, Koryak, kosraean, kpelle, kuanyama, kumyk (cyrillique), kurde (arabe), kurde (latin), kurukh (devanagari), kirghize (cyrillique), lak, lakota, latin, letton, lezghien, lingala, lituanien, bas-sorabe, lozi, Lule Sami, Luo (Kenya et Tanzanie), luxembourgeois, Luyia luy, macédonien, Machame, Madurese, Mahasu Pahari (Devanagari), Makhuwa-Meetto, Makonde, malgache, malais (latin), maltais, malto (Devanagari), Mandinka, Manx, Maori, Mapudungun, Marathi, Mari (Russie), Masai, Mende (Sierra Leone), Meru, Meta’, Minangkabau, Mohawk, mongol (cyrillique), Mongondow, monténégrin (cyrillique), monténégrin (latin), Morisyen, Mundang, Nahuatl, Navajo, Ndonga, napolitain, népalais, Ngomba, niuéen, Nogay, Ndebele du Nord, Sami du Nord (latin), norvégien, Nyanja, Nyankole, Nzima, occitan, Ojibwa, Oromo, Ossétique, Pampanga, Pangasinan, Papiamento, Pashto, Pedi, persan, polonais, portugais, pendjabi (arabe), quechua, riverain, roumain, romanche, rundi, russe, rwa, sadri (devanagari), sakha, samburu, samoan (latin), sango, sangu (gabon), sanskrit ( Devanagari), Santali(Devanagiri), écossais, gaélique écossais, Sena, serbe (cyrillique), serbe (latin), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Devanagari), Skolt Sami, slovaque, slovène, Soga, Somali (arabe), somali (latin), songhaï, ndebele du sud, altaï du sud, sami du sud, sotho du sud, espagnol, sundanais, swahili (latin), swati, suédois, tabassaran, tachelhit, tahitien, taita, tadjik (cyrillique), Tamoul, Tatar (cyrillique), Tatar (latin), Teso, Tetum, Thaï, Thangmi, Tok Pisin, Tongien, Tsonga, Tswana, Turc, Turkmène (latin), Touva, Oudmourte, Ouïgour (cyrillique), Ukrainien, Haut-Sorabe, Ourdou, ouïghour (arabe), ouzbek (arabe), ouzbek (cyrillique), ouzbek (latin), vietnamien, volapük, Vunjo, Walser, gallois, frison occidental, wolof, xhosa, maya yucatèque, zapotèque, zarma, zhuang, zoulou
Modèle pour les documents généraux
Les langues suivantes sont prises en charge lors de la formation d’un modèle de traitement de documents et de la sélection de Documents généraux comme type de document.
afrikaans, albanais, arabe, bulgare, chinois (Han (variante simplifiée)), chinois (Han (variante traditionnelle)), croate, tchèque, danois, néerlandais, estonien, finnois, français, allemand, hébreu, hindi, hongrois, indonésien, italien, japonais, coréen, letton, lituanien, macédonien, marathi, grec moderne (1453-), népalais (macrolangue), norvégien, panjabi, persan, polonais, portugais, roumain, russe, slovaque, slovène, somali (arabe), somali (latin), espagnol, swahili (macrolangage), suédois, tamoul, thaï, turc, ukrainien, ourdou, vietnamien
Conditions requises
Le traitement de documents fonctionne sur les documents d’entrée qui répondent aux exigences suivantes :
- Format JPG, PNG ou PDF (texte ou numérisé). Les PDF englobant du texte sont préférables, car il n’y aura pas d’erreurs au niveau de l’extraction et de l’emplacement des caractères.
- Les fichiers TIFF ne peuvent pas être utilisés pour la formation. Vous devrez utiliser des documents au format PDF, JPG ou PNG pour entraîner un modèle. Une fois le modèle entraîné, il peut extraire des données de fichiers TIFF lorsque le modèle est utilisé dans un flux cloud Power Automate.
- Si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant de les soumettre.
- La taille maximale des documents à traiter ne doit pas dépasser 20 Mo.
- Pour les images, les dimensions doivent être comprises entre 50 × 50 et 10 000 × 10 000 pixels.
- Si les numérisations se font à partir de documents papier, il doit s’agir d’images de haute qualité.
- Vous pouvez créer jusqu’à 200 collections par modèle.
- Dans un flux de cloud, la limite de champs pouvant être marqués pour le traitement de documents est de 300.
Note
- L’extraction de signatures de documents n’est actuellement pas prise en charge.
- Les champs qui se divisent dans les limites de la page ne sont actuellement pas pris en charge.
- Les lignes qui sautent d’une page à une autre ne sont actuellement pas prises en charge.
Conseil d’optimisation
Découvrez comment améliorer les performances des modèles de traitement de documents.