Del via


Forhåndsbygget tekstgjenkjenningsmodell

Den forhåndsbygde tekstgjenkjenningsmodellen trekker ut gjenkjente ord fra dokumenter og bilder til tegnstrømmer som kan leses av maskiner. Den bruker den nyeste optiske tegngjenkjenningen (OCR) til å oppdage trykket og håndskrevet tekst i bilder.

Denne modellen behandler bilder og dokumentfiler for å trekke ut linjer med trykt eller håndskrevet tekst.

Bruk i Power Apps

Den forhåndsbygde modellen for tekstgjenkjenning er tilgjengelig i Power Apps ved å bruke komponenten for tekstgjenkjenning. Mer informasjon:Bruke tekstgjenkjenningskomponenten i Power Apps

Bruke i Power Automate

Hvis du vil ha mer informasjon om hvordan du bruker denne modellen i Power Automate, kan du se Bruk den forhåndsbygde tekstgjenkjenningsmodellen i Power Automate.

Støttet språk, format og størrelse

Filene du kan skanne med tekstgjenkjenningsmodellen, må ha disse kjennetegnene:

  • Språk for trykt tekst: afrikaans, albansk, angika (devanagiri), arabisk, asturisk, awadhi-hindi (devanagiri), aserbajdsjansk (latin), bagheli, baskisk, hviterussisk (kyrillisk), hviterussisk (latinsk), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnisk (latinsk), brajbha, bretonsk, bulgarsk, bundeli, burjat, katalansk, cebuano, chambing, chamorro, chhattisgarhi (devanagiri), kinesisk (forenklet), kinesisk (tradisjonell), kornisk, korsikansk, krimtatarisk (latinsk), kroatisk, tsjekkisk, Dansk, dari, dhimal (devanagiri), dogri (devanagiri), nederlandsk, engelsk, erzya (kyrillisk), estisk, færøysk, fijiansk, filippinsk, finsk, fransk, friulisk, gagauz (latinsk), galisisk, tysk, gilbertesisk, gondi (devanagiri), grønlandsk, gurung (devanagiri), haitisk kreolsk, halbi (devanagiri), hani, haryanvi, hawaiisk, hindi, hmong daw (latinsk), ho (devanagiri), ungarsk, islandsk, enaresamisk, indonesisk, interlingua, inuktitut (latinsk), irsk, italiensk, japansk, jaunsari (devanagiri), javanesisk, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latin), Kasjubisk, Kasakhisk (kyrillisk), Kasakhisk (latin), Khaling, Khasi, K'iche', koreansk, Korku, Koryak, Kosraean, Kumyk (kyrillisk), Kurdisk (arabisk), Kurdisk (latin), Kurukh (Devanagiri), Kirgisisk (kyrillisk), Lakota, latin, litauisk, nedersorbisk, lulesamisk, luxembourgsk, Mahasu Pahari (Devanagiri), Malaysisk (latin), maltesisk, maltesisk, maltorisk (devanagiri), manx, maori, marathi, mongolsk (kyrillisk), Montenegrinsk (kyrillisk), montenegrinsk (latinsk), napolitansk, nepali, niueansk, nogay, nordsamisk (latinsk), norsk, oksitansk, ossetisk, pashto, persisk, polsk, portugisisk, punjabi (arabisk), ripuariansk, rumensk, romansk, russisk, sadri (devanagiri), samoansk (latinsk), sanskrit (devanagari), santali (devanagiri), skotsk, skotsk gælisk, serbisk (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltesamisk, slovakisk, slovensk, somalisk (arabisk), sørsamisk, spansk, swahili (latin), svensk, tadsjikisk (kyrillisk), tatarisk (latinsk), tetum, thangmi, tongansk, tyrkisk, turkmensk (latin), tuvan, øvre sorbisk, urdu, uigurisk (arabisk), usbekisk (arabisk), usbekisk (kyrillisk), usbekisk (latinsk), volapük, walser, walisisk, vestfrisisk, yucatec maya, zhuang, zulu
  • Språk for håndskrevet tekst: engelsk, kinesisk (forenklet), fransk, tysk, italiensk, japansk, koreansk, portugisisk, spansk
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Størrelse: 20 MB maksimum
  • For PDF-dokumenter behandles bare de første 2000 sidene.

Modellutdata

Hvis det oppdages tekst, vil tekstgjenkjenningsmodellen gi følgende informasjon:

  • Resultater: En liste over linjer hentet fra inndatateksten.
  • Tekst: Strenger som inneholder tekstlinjen som er oppdaget.
  • BoundingBox: Fire verdier som representerer markeringsrammen, beskrevet ved hjelp av topp- og venstreposisjonen sammen med bredden og høyden.

Grenser

Handling Grense Fornyelsesperiode
Tekstgjenkjenningskall (per miljø) 480 60 sekunder

Opplæring: Gjenkjenn tekst med AI Builder (modul)