Del via


Forudbygget tekstgenkendelsesmodel

Den færdigbyggede model til tekstgenkendelse udtrækker ord fra dokumenter og billeder til maskinlæsbare tegnstrømme. De bruger den nyeste optiske tegngenkendelse (OCR) til at registrere trykt og håndskrevet tekst i billeder.

Denne model behandler billeder og dokumentfiler for at udtrække linjer af trykt eller håndskrevet tekst.

Brug i Power Apps

Den forudbyggede model til tekstgenkendelse er tilgængelig i Power Apps ved hjælp af komponenten til tekstgenkendelse. Få flere oplysninger her: Anvend komponenten til tekstgenkendelse i Power Apps

Brug i Power Automate

Du kan finde oplysninger om, hvordan du bruger denne model i Power Automate, under Brug af den foruddefinerede tekstgenkendelsesmodel i Power Automate.

Understøttet sprog, format og størrelse

De filer, du kan scanne med tekstgenkendelsesmodellen, skal have følgende egenskaber:

  • Sprog til trykt tekst: afrikaans, albansk, angika (devanagiri), arabisk, asturisk, awadhi-hindi (devanagiri), aserbajdsjansk (latin), bagheli, baskisk, hviderussisk (kyrillisk), hviderussisk (latin), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnisk (latin), brajbha, bretonsk, bulgarsk, bundeli, burjat-hindi (kyrillisk), catalansk, cebuano, chambandi, chamorro, chhattisgarhi (devanagiri), kinesisk (forenklet), kinesisk (traditionelt), kornisk, korsikansk, krimtatarisk (latinsk), kroatisk, tjekkisk, Dansk, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Hollandsk, Engelsk, Erzya (kyrillisk), Estisk, Færøsk, Fijiansk, Filippinsk, Finsk, Fransk, Friuliansk, Gagauz (latinsk), Galicisk, Tysk, Gilbertesisk, Gondi (Devanagiri), Grønlandsk, Gurung (Devanagiri), Haitisk kreolsk, Halbi (Devanagiri), Hani, Haryanvi, Hawaiiansk, Hindi, Hmong Daw (latin), Ho(Devanagiri), Ungarsk, Islandsk, Enaresamisk, Indonesisk, Interlingua, Inuktitut (latinsk), Irsk, Italiensk, Japansk, Jaunsari (Devanagiri), Javanesisk, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latin), Kasjubisk, Kasakhisk (kyrillisk), Kasakhisk (latin), Khaling, Khasi, K'iche', koreansk, Korku, Koryak, Kosraean, Kumyk (kyrillisk), Kurdisk (arabisk), Kurdisk (latin), Kurukh (Devanagiri), Kirgisisk (kyrillisk), Lakota, latin, litauisk, nedersorbisk, lulesamisk, luxembourgsk, Mahasu Pahari (Devanagiri), malaysisk (latin), maltesisk, maltorisk (devanagiri), manx, maori, marathi, mongolsk (kyrillisk), Montenegrinsk (kyrillisk), montenegrinsk (latin), napolitansk, nepalesisk, niueansk, nogay, nordsamisk (latin), norsk, occitansk, ossetisk, pashto, persisk, polsk, portugisisk, punjabi (arabisk), ripuariansk, rumænsk, romansk, russisk, sadri (devanagiri), samoansk (latinsk), sanskrit (devanagari), santali (devanagiri), skotsk, skotsk gælisk, serbisk (latin), sherpa (devanagiri), sirmauri (devanagiri), skoltesamisk, slovakisk, slovensk, somalisk (arabisk), sydsamisk, spansk, swahili (latin), svensk, tadsjikisk (kyrillisk), tatarisk (latin), tetum, thangmi, tongansk, tyrkisk, turkmensk (latin), tuvan, øvre sorbisk, urdu, uyghur (arabisk), usbekisk (arabisk), usbekisk (kyrillisk), usbekisk (latin), volapük, walser, walisisk, vestfrisisk, yucatec maya, zhuang, zulu
  • Sprog for håndskrevet tekst: engelsk, kinesisk (forenklet), fransk, tysk, italiensk, japansk, koreansk, portugisisk, spansk
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Størrelse: 20 MB maks.
  • I forbindelse med PDF-dokumenter behandles kun de første 2,000 sider.

Modeloutput

Hvis der registreres et dokument, generer modellen til tekstgenkendelse følgende oplysninger:

  • Resultater: En liste over linjer, der er udtrukket fra inputteksten.
  • Tekst: Strenge, der indeholder den registrerede tekstlinje.
  • BoundingBox: Fire værdier, der repræsenterer afgrænsningsrammen, beskrevet ved hjælp af den øverste og venstre position sammen med dens bredde og højde.

Grænser

Handling Grænse Fornyelsesperiode
Opkald til tekstgenkendelse (pr. miljø) 480 60 sekunder

Træning: Genkende tekst med AI Builder (modul)