Modelo precompilado de reconocimiento de texto
El modelo de precompilado de reconocimiento de texto extrae palabras de documentos e imágenes en secuencias de caracteres que puede leer una máquina. Usan el reconocimiento óptico de caracteres (OCR) avanzado para detectar texto impreso y manuscrito en las imágenes.
Este modelo procesa archivos de imágenes y documento para extraer líneas de texto impreso o manuscrito.
Uso en Power Apps
El modelo de reconocimiento de texto precompilado está disponible en Power Apps mediante el componente de reconocedor de texto. Más información: Usar el componente de reconocimiento de texto en Power Apps
Uso en Power Automate
Para obtener información sobre cómo utilizar este modelo en Power Automate, vea Utilizar el modelo precompilado de reconocimiento de texto en Power Automate.
Idioma, formato y tamaño admitidos
Los archivos que puede escanear con el modelo de reconocimiento de texto deben tener estas características:
- Idioma del texto impreso: afrikáans, albanés, angika (devanagiri), árabe, asturiano, awadhi-hindi (devanagiri), azerbaiyano (latín), bagheli, vasco, bielorruso (cirílico), bielorruso (latín), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosnio (latín), brajbha, bretón, búlgaro, Bundeli, buriato (cirílico), catalán, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), chino (simplificado), chino (tradicional), cornualles, corso, tártaro de Crimea (latín), croata, checo, danés, dari, dhimal ( devanagiri), dogri (devanagiri), holandés, inglés, erzya (cirílico), estonio, feroés, fiyiano, filipino, finlandés, francés, friulano, gagauz (latín), gallego, alemán, gilbertés, gondi (devanagiri), groenlandés, gurung (devanagiri), criollo haitiano, halbi (devanagiri), hani, haryanvi, hawaiano, hindi, hmong daw (latín), ho (devanagiri), Húngaro, islandés, inari sami, indonesio, interlingua, inuktitut (latín), irlandés, italiano, japonés, jaunsari (Devanagiri), javanés, Kabuverdianu, Kachin (latín), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cirílico), Kara-Kalpak (latín), casubio, kazajo (cirílico), kazajo (latín), Khaling, Khasi, k'iche', coreano, korku, koryak, kosraean, kumyk (cirílico), kurdo (árabe), kurdo (latín), kurukh (Devanagiri), kirguís (cirílico), lakota, latín, lituano, bajo sorbio, lule sami, luxemburgués, mahasu pahari (devanagiri), malayo (latín), maltés, malto (devanagiri), manés, maorí, marathi, mongol (cirílico). ), montenegrino (cirílico), montenegrino (latín), napolitano, nepalí, niueano, nogay, Sami septentrional (latín), noruego, occitano, osético, pastún, persa, polaco, portugués, punjabi (árabe), ripuario, rumano, romanche, ruso, sadri (devanagiri), samoano (latín), sánscrito (devanagari), santali ( devanagiri), escocés, gaélico escocés, serbio (latín), sherpa (devanagiri), sirmauri (devanagiri), skolt sami, eslovaco, esloveno, somalí (árabe), Sami del sur, español, swahili (latín), sueco, tayiko (cirílico), tártaro (latín), tetum, thangmi, tongano, turco, turcomano (latín), tuvano, alto sorbio, urdu, uigur (árabe), uzbeko (árabe). ), uzbeko (cirílico), uzbeko (latín), volapük, walser, galés, frisón occidental, maya yucateco, zhuang, zulú
- Idioma para texto escrito a mano: inglés, chino (simplificado), francés, alemán, italiano, japonés, coreano, portugués, español
- Formato:
- JPG
- PNG
- BMP
- Tamaño: 20 MB máximo
- En los documentos PDF, solo se procesan las primeras 2,000 páginas.
Salida de modelo
Si se detecta un documento, el modelo de reconocimiento de texto genera la siguiente información:
- Resultados: Una lista de líneas extraídas del texto de entrada.
- Texto: Cadenas que contienen la línea de texto detectada.
- BoundingBox: Cuatro valores que representan el cuadro delimitador, descritos mediante las posiciones superior e izquierda junto con su ancho y alto.
Límites
Acción | Límite | Periodo de renovación |
---|---|---|
Llamadas de reconocimiento de texto (por entorno) | 480 | 60 segundos |