Forhåndsbygget tekstgjenkjenningsmodell

Artikkel
12/09/2024

Den forhåndsbygde tekstgjenkjenningsmodellen trekker ut gjenkjente ord fra dokumenter og bilder til tegnstrømmer som kan leses av maskiner. Den bruker den nyeste optiske tegngjenkjenningen (OCR) til å oppdage trykket og håndskrevet tekst i bilder.

Denne modellen behandler bilder og dokumentfiler for å trekke ut linjer med trykt eller håndskrevet tekst.

Bruk i Power Apps

Den forhåndsbygde modellen for tekstgjenkjenning er tilgjengelig i Power Apps ved å bruke komponenten for tekstgjenkjenning. Mer informasjon:Bruke tekstgjenkjenningskomponenten i Power Apps

Bruke i Power Automate

Hvis du vil ha mer informasjon om hvordan du bruker denne modellen i Power Automate, kan du se Bruk den forhåndsbygde tekstgjenkjenningsmodellen i Power Automate.

Støttet språk, format og størrelse

Filene du kan skanne med tekstgjenkjenningsmodellen, må ha disse kjennetegnene:

Språk for trykt tekst: afrikaans, albansk, angika (devanagiri), arabisk, asturisk, awadhi-hindi (devanagiri), aserbajdsjansk (latin), bagheli, baskisk, hviterussisk (kyrillisk), hviterussisk (latinsk), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnisk (latinsk), brajbha, bretonsk, bulgarsk, bundeli, burjat, katalansk, cebuano, chambing, chamorro, chhattisgarhi (devanagiri), kinesisk (forenklet), kinesisk (tradisjonell), kornisk, korsikansk, krimtatarisk (latinsk), kroatisk, tsjekkisk, Dansk, dari, dhimal (devanagiri), dogri (devanagiri), nederlandsk, engelsk, erzya (kyrillisk), estisk, færøysk, fijiansk, filippinsk, finsk, fransk, friulisk, gagauz (latinsk), galisisk, tysk, gilbertesisk, gondi (devanagiri), grønlandsk, gurung (devanagiri), haitisk kreolsk, halbi (devanagiri), hani, haryanvi, hawaiisk, hindi, hmong daw (latinsk), ho (devanagiri), ungarsk, islandsk, enaresamisk, indonesisk, interlingua, inuktitut (latinsk), irsk, italiensk, japansk, jaunsari (devanagiri), javanesisk, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latin), Kasjubisk, Kasakhisk (kyrillisk), Kasakhisk (latin), Khaling, Khasi, K'iche', koreansk, Korku, Koryak, Kosraean, Kumyk (kyrillisk), Kurdisk (arabisk), Kurdisk (latin), Kurukh (Devanagiri), Kirgisisk (kyrillisk), Lakota, latin, litauisk, nedersorbisk, lulesamisk, luxembourgsk, Mahasu Pahari (Devanagiri), Malaysisk (latin), maltesisk, maltesisk, maltorisk (devanagiri), manx, maori, marathi, mongolsk (kyrillisk), Montenegrinsk (kyrillisk), montenegrinsk (latinsk), napolitansk, nepali, niueansk, nogay, nordsamisk (latinsk), norsk, oksitansk, ossetisk, pashto, persisk, polsk, portugisisk, punjabi (arabisk), ripuariansk, rumensk, romansk, russisk, sadri (devanagiri), samoansk (latinsk), sanskrit (devanagari), santali (devanagiri), skotsk, skotsk gælisk, serbisk (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltesamisk, slovakisk, slovensk, somalisk (arabisk), sørsamisk, spansk, swahili (latin), svensk, tadsjikisk (kyrillisk), tatarisk (latinsk), tetum, thangmi, tongansk, tyrkisk, turkmensk (latin), tuvan, øvre sorbisk, urdu, uigurisk (arabisk), usbekisk (arabisk), usbekisk (kyrillisk), usbekisk (latinsk), volapük, walser, walisisk, vestfrisisk, yucatec maya, zhuang, zulu
Språk for håndskrevet tekst: engelsk, kinesisk (forenklet), fransk, tysk, italiensk, japansk, koreansk, portugisisk, spansk
Format:
- JPG
- PNG
- BMP
- PDF
Størrelse: 20 MB maksimum
For PDF-dokumenter behandles bare de første 2000 sidene.

Modellutdata

Hvis det oppdages tekst, vil tekstgjenkjenningsmodellen gi følgende informasjon:

Resultater: En liste over linjer hentet fra inndatateksten.
Tekst: Strenger som inneholder tekstlinjen som er oppdaget.
BoundingBox: Fire verdier som representerer markeringsrammen, beskrevet ved hjelp av topp- og venstreposisjonen sammen med bredden og høyden.

Grenser

Handling	Grense	Fornyelsesperiode
Tekstgjenkjenningskall (per miljø)	480	60 sekunder

Opplæring: Gjenkjenn tekst med AI Builder (modul)

Del via

Forhåndsbygget tekstgjenkjenningsmodell

Bruk i Power Apps

Bruke i Power Automate

Støttet språk, format og størrelse

Modellutdata

Grenser

Tilbakemeldinger

Flere ressurser

Del via

Forhåndsbygget tekstgjenkjenningsmodell

Bruk i Power Apps

Bruke i Power Automate

Støttet språk, format og størrelse

Modellutdata

Grenser

Relatert informasjon

Tilbakemeldinger

Flere ressurser