Forudbygget tekstgenkendelsesmodel
Den færdigbyggede model til tekstgenkendelse udtrækker ord fra dokumenter og billeder til maskinlæsbare tegnstrømme. De bruger den nyeste optiske tegngenkendelse (OCR) til at registrere trykt og håndskrevet tekst i billeder.
Denne model behandler billeder og dokumentfiler for at udtrække linjer af trykt eller håndskrevet tekst.
Brug i Power Apps
Den forudbyggede model til tekstgenkendelse er tilgængelig i Power Apps ved hjælp af komponenten til tekstgenkendelse. Få flere oplysninger her: Anvend komponenten til tekstgenkendelse i Power Apps
Brug i Power Automate
Du kan finde oplysninger om, hvordan du bruger denne model i Power Automate, under Brug af den foruddefinerede tekstgenkendelsesmodel i Power Automate.
Understøttet sprog, format og størrelse
De filer, du kan scanne med tekstgenkendelsesmodellen, skal have følgende egenskaber:
- Sprog til trykt tekst: afrikaans, albansk, angika (devanagiri), arabisk, asturisk, awadhi-hindi (devanagiri), aserbajdsjansk (latin), bagheli, baskisk, hviderussisk (kyrillisk), hviderussisk (latin), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnisk (latin), brajbha, bretonsk, bulgarsk, bundeli, burjat-hindi (kyrillisk), catalansk, cebuano, chambandi, chamorro, chhattisgarhi (devanagiri), kinesisk (forenklet), kinesisk (traditionelt), kornisk, korsikansk, krimtatarisk (latinsk), kroatisk, tjekkisk, Dansk, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Hollandsk, Engelsk, Erzya (kyrillisk), Estisk, Færøsk, Fijiansk, Filippinsk, Finsk, Fransk, Friuliansk, Gagauz (latinsk), Galicisk, Tysk, Gilbertesisk, Gondi (Devanagiri), Grønlandsk, Gurung (Devanagiri), Haitisk kreolsk, Halbi (Devanagiri), Hani, Haryanvi, Hawaiiansk, Hindi, Hmong Daw (latin), Ho(Devanagiri), Ungarsk, Islandsk, Enaresamisk, Indonesisk, Interlingua, Inuktitut (latinsk), Irsk, Italiensk, Japansk, Jaunsari (Devanagiri), Javanesisk, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latin), Kasjubisk, Kasakhisk (kyrillisk), Kasakhisk (latin), Khaling, Khasi, K'iche', koreansk, Korku, Koryak, Kosraean, Kumyk (kyrillisk), Kurdisk (arabisk), Kurdisk (latin), Kurukh (Devanagiri), Kirgisisk (kyrillisk), Lakota, latin, litauisk, nedersorbisk, lulesamisk, luxembourgsk, Mahasu Pahari (Devanagiri), malaysisk (latin), maltesisk, maltorisk (devanagiri), manx, maori, marathi, mongolsk (kyrillisk), Montenegrinsk (kyrillisk), montenegrinsk (latin), napolitansk, nepalesisk, niueansk, nogay, nordsamisk (latin), norsk, occitansk, ossetisk, pashto, persisk, polsk, portugisisk, punjabi (arabisk), ripuariansk, rumænsk, romansk, russisk, sadri (devanagiri), samoansk (latinsk), sanskrit (devanagari), santali (devanagiri), skotsk, skotsk gælisk, serbisk (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltesamisk, slovakisk, slovensk, somalisk (arabisk), sydsamisk, spansk, swahili (latin), svensk, tadsjikisk (kyrillisk), tatarisk (latin), tetum, thangmi, tongansk, tyrkisk, turkmensk (latin), tuvan, øvre sorbisk, urdu, uyghur (arabisk), usbekisk (arabisk), usbekisk (kyrillisk), usbekisk (latin), volapük, walser, walisisk, vestfrisisk, yucatec maya, zhuang, zulu
- Sprog for håndskrevet tekst: engelsk, kinesisk (forenklet), fransk, tysk, italiensk, japansk, koreansk, portugisisk, spansk
- Format:
- JPG
- PNG
- BMP
- Størrelse: 20 MB maks.
- I forbindelse med PDF-dokumenter behandles kun de første 2,000 sider.
Modeloutput
Hvis der registreres et dokument, generer modellen til tekstgenkendelse følgende oplysninger:
- Resultater: En liste over linjer, der er udtrukket fra inputteksten.
- Tekst: Strenge, der indeholder den registrerede tekstlinje.
- BoundingBox: Fire værdier, der repræsenterer afgrænsningsrammen, beskrevet ved hjælp af den øverste og venstre position sammen med dens bredde og højde.
Grænser
Handling | Grænse | Fornyelsesperiode |
---|---|---|
Opkald til tekstgenkendelse (pr. miljø) | 480 | 60 sekunder |