Forudbygget tekstgenkendelsesmodel

Artikel
12/09/2024

Den færdigbyggede model til tekstgenkendelse udtrækker ord fra dokumenter og billeder til maskinlæsbare tegnstrømme. De bruger den nyeste optiske tegngenkendelse (OCR) til at registrere trykt og håndskrevet tekst i billeder.

Denne model behandler billeder og dokumentfiler for at udtrække linjer af trykt eller håndskrevet tekst.

Brug i Power Apps

Den forudbyggede model til tekstgenkendelse er tilgængelig i Power Apps ved hjælp af komponenten til tekstgenkendelse. Få flere oplysninger her: Anvend komponenten til tekstgenkendelse i Power Apps

Brug i Power Automate

Du kan finde oplysninger om, hvordan du bruger denne model i Power Automate, under Brug af den foruddefinerede tekstgenkendelsesmodel i Power Automate.

Understøttet sprog, format og størrelse

De filer, du kan scanne med tekstgenkendelsesmodellen, skal have følgende egenskaber:

Sprog til trykt tekst: afrikaans, albansk, angika (devanagiri), arabisk, asturisk, awadhi-hindi (devanagiri), aserbajdsjansk (latin), bagheli, baskisk, hviderussisk (kyrillisk), hviderussisk (latin), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnisk (latin), brajbha, bretonsk, bulgarsk, bundeli, burjat-hindi (kyrillisk), catalansk, cebuano, chambandi, chamorro, chhattisgarhi (devanagiri), kinesisk (forenklet), kinesisk (traditionelt), kornisk, korsikansk, krimtatarisk (latinsk), kroatisk, tjekkisk, Dansk, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Hollandsk, Engelsk, Erzya (kyrillisk), Estisk, Færøsk, Fijiansk, Filippinsk, Finsk, Fransk, Friuliansk, Gagauz (latinsk), Galicisk, Tysk, Gilbertesisk, Gondi (Devanagiri), Grønlandsk, Gurung (Devanagiri), Haitisk kreolsk, Halbi (Devanagiri), Hani, Haryanvi, Hawaiiansk, Hindi, Hmong Daw (latin), Ho(Devanagiri), Ungarsk, Islandsk, Enaresamisk, Indonesisk, Interlingua, Inuktitut (latinsk), Irsk, Italiensk, Japansk, Jaunsari (Devanagiri), Javanesisk, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latin), Kasjubisk, Kasakhisk (kyrillisk), Kasakhisk (latin), Khaling, Khasi, K'iche', koreansk, Korku, Koryak, Kosraean, Kumyk (kyrillisk), Kurdisk (arabisk), Kurdisk (latin), Kurukh (Devanagiri), Kirgisisk (kyrillisk), Lakota, latin, litauisk, nedersorbisk, lulesamisk, luxembourgsk, Mahasu Pahari (Devanagiri), malaysisk (latin), maltesisk, maltorisk (devanagiri), manx, maori, marathi, mongolsk (kyrillisk), Montenegrinsk (kyrillisk), montenegrinsk (latin), napolitansk, nepalesisk, niueansk, nogay, nordsamisk (latin), norsk, occitansk, ossetisk, pashto, persisk, polsk, portugisisk, punjabi (arabisk), ripuariansk, rumænsk, romansk, russisk, sadri (devanagiri), samoansk (latinsk), sanskrit (devanagari), santali (devanagiri), skotsk, skotsk gælisk, serbisk (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltesamisk, slovakisk, slovensk, somalisk (arabisk), sydsamisk, spansk, swahili (latin), svensk, tadsjikisk (kyrillisk), tatarisk (latin), tetum, thangmi, tongansk, tyrkisk, turkmensk (latin), tuvan, øvre sorbisk, urdu, uyghur (arabisk), usbekisk (arabisk), usbekisk (kyrillisk), usbekisk (latin), volapük, walser, walisisk, vestfrisisk, yucatec maya, zhuang, zulu
Sprog for håndskrevet tekst: engelsk, kinesisk (forenklet), fransk, tysk, italiensk, japansk, koreansk, portugisisk, spansk
Format:
- JPG
- PNG
- BMP
- PDF
Størrelse: 20 MB maks.
I forbindelse med PDF-dokumenter behandles kun de første 2,000 sider.

Modeloutput

Hvis der registreres et dokument, generer modellen til tekstgenkendelse følgende oplysninger:

Resultater: En liste over linjer, der er udtrukket fra inputteksten.
Tekst: Strenge, der indeholder den registrerede tekstlinje.
BoundingBox: Fire værdier, der repræsenterer afgrænsningsrammen, beskrevet ved hjælp af den øverste og venstre position sammen med dens bredde og højde.

Grænser

Handling	Grænse	Fornyelsesperiode
Opkald til tekstgenkendelse (pr. miljø)	480	60 sekunder

Træning: Genkende tekst med AI Builder (modul)

Del via

Forudbygget tekstgenkendelsesmodel

Brug i Power Apps

Brug i Power Automate

Understøttet sprog, format og størrelse

Modeloutput

Grænser

Feedback

Yderligere ressourcer

Del via

Forudbygget tekstgenkendelsesmodel

Brug i Power Apps

Brug i Power Automate

Understøttet sprog, format og størrelse

Modeloutput

Grænser

Relaterede oplysninger

Feedback

Yderligere ressourcer