Sdílet prostřednictvím


Předem připravený model pro rozpoznávání textu

Předem vytvořený model pro rozpoznávání textu extrahuje slova z dokumentů a obrázků do strojově čitelných znakových proudů. Používá moderní technologii optického rozpoznávání znaků (OCR) ke zjišťování tištěného a rukopisného textu v obrázcích.

Tento model zpracovává soubory obrázků a dokumentů a extrahuje z nich řádky tištěného nebo rukopisného textu.

Používáno v Power Apps

Předem vytvořený model pro rozpoznávání textu je k dispozici v Power Apps prostřednictvím komponenty pro rozpoznávání textu. Více informací:Použití součásti pro rozpoznávání textu v Power Apps

Použití v Power Automate

Informace o tom, jak používat tento model v Power Automate, viz Použijte předem připravený model rozpoznávání textu Power Automate.

Podporovaný jazyk, formát a velikost

Soubory, které se dají prohledávat pomocí tohoto modelu pro rozpoznávání textu, musí mít tyto charakteristiky:

  • Jazyk pro tištěný text: afrikánština, albánština, angika (dévanágiri), arabština, asturština, awadhi-hindština (dévanágiri), ázerbájdžánština (latinka), bagelština, baskičtina, běloruština (cyrilice), běloruština (latinka), bhojpuri-hindština (dévanágiri), bislama, bodo (dévanágirí), bosenština (latinka), brajbha, bretonština, bulharština, bundeli, burjatština (cyrilice), katalánština, cebuánština, chamling, chamorro, čhattisgarhi (dévanágiri), čínština (zjednodušená), čínština (tradiční), kornština, korsika, krymská tatarština (latinka), chorvatština, čeština, dánština, dari, dhimal (dévanágiri), dogri (dévanágirí), holandština, angličtina, Erzya (cyrilice), estonština, faerština, fidžijština, filipínština, finština, francouzština, friulština, gagauzština (latinka), galicijština, němčina, gilbertština, gondi (dévanágiri), grónština, gurung (dévanágiri), haitská kreolština, halbi (dévanágiri), hani, haryanvi, havajština, hindština, hmong Daw (latinka), Ho (Devanagiri), Maďarština, Islandština, Inari Sami, Indonéština, Interlingua, Inuktitut (latinka), Irština, Italština, Japonština, Jaunsari (Devanagiri), Jávština, Kabuverdianu, Kachin (latinka), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cyrilice), Kara-Kalpak (lat.), Kašubština, Kazachština (cyrilice), kazašština (latinka), Khaling, Khasi, K'iche', korejština, Korku, Korjak, Kosraean, Kumyk (cyrilice), Kurdština (Arabština), Kurdština (latinka), Kurukh (Devanagiri), Kyrgyzština (cyrilice), lakota, latina, litevština, dolnolužická srbština, lule sámština, lucemburština, mahasu pahari (dévanágiri), malajština (latinka), maltština, maltoština (dévanágiri), manština, maorština, maráthština, mongolština (azbuka), černohorština (azbuka), černohorština (latinka), neapolština, nepálština, niuejština, nogay, severní sámština (latinka), norština, okcitánština, osetština, paštština, perština, polština, portugalština, pandžábština (arabština), ripuárština, rumunština, rétorománština, ruština, sadri (dévanágiri), samojština (latinka), sanskrt (dévanágarí), santalština (dévánágiri), skotština, skotská gaelština, srbština (latinka), šerpa (dévánágiri), sirmaurština (dévánágiri), skoltská sama, slovenština, slovinština, somálština (arabština), jižní sámština, španělština, svahilština (latinka), švédština, tádžština (cyrilice), tatarština (latinka), tetum, thangmi, tonžština, turečtina, turkmenština (latinka), tuvanština, hornolužická srbština, urdština, ujgurština (arabština), uzbecká (arabština), uzbecká (azbuka), uzbekština (latinka), volapük, Walser, velština, západní Fríština, Yucatec Maya, Zhuang, Zulu
  • Jazyk pro ručně psaný text: angličtina, čínština (zjednodušená), francouzština, němčina, italština, japonština, korejština, portugalština, španělština
  • Formát:
    • JPG
    • PNG
    • BMP
    • PDF
  • Velikost: maximálně 20 MB
  • U dokumentů PDF se zpracuje pouze prvních 2,000 stránek.

Výstup modelu

Při zjištění dokumentu jsou výstupem modelu pro rozpoznávání textu tyto informace:

  • Výsledky: Seznam řádků extrahovaných ze vstupního textu.
  • Text: Řetězce obsahující detekovaný řádek textu.
  • BoundingBox: Čtyři hodnoty představující ohraničovací rámeček, popsané pomocí horní a levé pozice spolu s jeho šířkou a výškou.

Limity

Akce Limit Období prodloužení
Volání rozpoznávání textu (podle prostředí) 480 60 sekund

Cvičení: Rozpoznejte text pomocí AI Builder (modul)