Forhåndsbygget tekstgjenkjenningsmodell
Den forhåndsbygde tekstgjenkjenningsmodellen trekker ut gjenkjente ord fra dokumenter og bilder til tegnstrømmer som kan leses av maskiner. Den bruker den nyeste optiske tegngjenkjenningen (OCR) til å oppdage trykket og håndskrevet tekst i bilder.
Denne modellen behandler bilder og dokumentfiler for å trekke ut linjer med trykt eller håndskrevet tekst.
Bruk i Power Apps
Den forhåndsbygde modellen for tekstgjenkjenning er tilgjengelig i Power Apps ved å bruke komponenten for tekstgjenkjenning. Mer informasjon:Bruke tekstgjenkjenningskomponenten i Power Apps
Bruke i Power Automate
Hvis du vil ha mer informasjon om hvordan du bruker denne modellen i Power Automate, kan du se Bruk den forhåndsbygde tekstgjenkjenningsmodellen i Power Automate.
Støttet språk, format og størrelse
Filene du kan skanne med tekstgjenkjenningsmodellen, må ha disse kjennetegnene:
- Språk for trykt tekst: afrikaans, albansk, angika (devanagiri), arabisk, asturisk, awadhi-hindi (devanagiri), aserbajdsjansk (latin), bagheli, baskisk, hviterussisk (kyrillisk), hviterussisk (latinsk), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnisk (latinsk), brajbha, bretonsk, bulgarsk, bundeli, burjat, katalansk, cebuano, chambing, chamorro, chhattisgarhi (devanagiri), kinesisk (forenklet), kinesisk (tradisjonell), kornisk, korsikansk, krimtatarisk (latinsk), kroatisk, tsjekkisk, Dansk, dari, dhimal (devanagiri), dogri (devanagiri), nederlandsk, engelsk, erzya (kyrillisk), estisk, færøysk, fijiansk, filippinsk, finsk, fransk, friulisk, gagauz (latinsk), galisisk, tysk, gilbertesisk, gondi (devanagiri), grønlandsk, gurung (devanagiri), haitisk kreolsk, halbi (devanagiri), hani, haryanvi, hawaiisk, hindi, hmong daw (latinsk), ho (devanagiri), ungarsk, islandsk, enaresamisk, indonesisk, interlingua, inuktitut (latinsk), irsk, italiensk, japansk, jaunsari (devanagiri), javanesisk, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latin), Kasjubisk, Kasakhisk (kyrillisk), Kasakhisk (latin), Khaling, Khasi, K'iche', koreansk, Korku, Koryak, Kosraean, Kumyk (kyrillisk), Kurdisk (arabisk), Kurdisk (latin), Kurukh (Devanagiri), Kirgisisk (kyrillisk), Lakota, latin, litauisk, nedersorbisk, lulesamisk, luxembourgsk, Mahasu Pahari (Devanagiri), Malaysisk (latin), maltesisk, maltesisk, maltorisk (devanagiri), manx, maori, marathi, mongolsk (kyrillisk), Montenegrinsk (kyrillisk), montenegrinsk (latinsk), napolitansk, nepali, niueansk, nogay, nordsamisk (latinsk), norsk, oksitansk, ossetisk, pashto, persisk, polsk, portugisisk, punjabi (arabisk), ripuariansk, rumensk, romansk, russisk, sadri (devanagiri), samoansk (latinsk), sanskrit (devanagari), santali (devanagiri), skotsk, skotsk gælisk, serbisk (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltesamisk, slovakisk, slovensk, somalisk (arabisk), sørsamisk, spansk, swahili (latin), svensk, tadsjikisk (kyrillisk), tatarisk (latinsk), tetum, thangmi, tongansk, tyrkisk, turkmensk (latin), tuvan, øvre sorbisk, urdu, uigurisk (arabisk), usbekisk (arabisk), usbekisk (kyrillisk), usbekisk (latinsk), volapük, walser, walisisk, vestfrisisk, yucatec maya, zhuang, zulu
- Språk for håndskrevet tekst: engelsk, kinesisk (forenklet), fransk, tysk, italiensk, japansk, koreansk, portugisisk, spansk
- Format:
- JPG
- PNG
- BMP
- Størrelse: 20 MB maksimum
- For PDF-dokumenter behandles bare de første 2000 sidene.
Modellutdata
Hvis det oppdages tekst, vil tekstgjenkjenningsmodellen gi følgende informasjon:
- Resultater: En liste over linjer hentet fra inndatateksten.
- Tekst: Strenger som inneholder tekstlinjen som er oppdaget.
- BoundingBox: Fire verdier som representerer markeringsrammen, beskrevet ved hjelp av topp- og venstreposisjonen sammen med bredden og høyden.
Grenser
Handling | Grense | Fornyelsesperiode |
---|---|---|
Tekstgjenkjenningskall (per miljø) | 480 | 60 sekunder |