Inbyggd modell för textidentifiering
Den inbyggda textigenkänningsmodellen kan extrahera identifierade ord från dokument och bilder till maskinläsbara teckenströmmar. Den använder OCR (optisk teckenläsning) till att identifiera tryckt och handskriven text i bilder.
Denna modell bearbetar bilder och dokumentfiler för att extrahera rader med tryckt eller handskriven text.
Används i Power Apps
Den fördefinierade textigenkänningsmodellen är tillgänglig i Power Apps via textigenkänningskomponenten. Mer information: Använda textigenkänningskomponenten i Power Apps
Används i Power Automate
Information om hur du använder den här modellen i Power Automate finns i Använda den fördefinierade modellen för textidentifiering i Power Automate.
Språk, format och storlek som stöds
De filer som du kan skanna med textigenkänningsmodellen måste ha följande egenskaper:
- Språk för tryckt text: afrikaans, albanska, angika (devanagiri), arabiska, asturiska, awadhi-hindi (devanagiri), azerbajdzjanska (latinsk), bagheli, baskiska, vitryska (kyrilliska), vitryska (latinsk), bhojpuri-hindi (devanagiri), bislama, bodó (devanagiri), bosniska (latinsk), brajbha, bretonska, bulgariska, bundeli, burjatiska (kyrilliska), katalanska, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinesiska (förenklad), kinesiska (traditionell), korniska, korsikanska, krimtatariska (latinsk), kroatiska, tjeckiska, Danska, dari, dhimal (devanagiri), dogri (devanagiri), nederländska, engelska, erzya (kyrillisk), estniska, färöiska, fijianska, filippinska, finska, franska, friuliska, gagauz (latinsk), galiciska, tyska, gilbertesiska, gondi (devanagiri), grönländska, gurung (devanagiri), haitisk kreol, halbi (devanagiri), hani, haryanvi, hawaiianska, hindi, hmong daw (latinsk), ho (devanagiri), ungerska, isländska, inarisamiska, indonesiska, interlingua, inuktitut (latin), irländska, italienska, japanska, jaunsari (devanagiri), javanesiska, Kabuverdianu, Kachin (latinsk), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latinsk), kasjubiska, kazakiska (kyrillisk), kazakiska (latinsk), Khaling, Khasi, K'iche', koreanska, Korku, Koryak, kosraeanska, Kumyk (kyrilliska), kurdiska (arabiska), kurdiska (latin), kurukh (devanagiri), kirgiziska (kyrilliska), lakota, latin, litauiska, lågsorbiska, lulesamiska, luxemburgiska, Mahasu Pahari (Devanagiri), malajiska (latin), maltesiska, maltesiska, malto (devanagiri), manx, maori, marathi, mongoliska (kyrilliska), Montenegrinska (kyrilliska), montenegrinska (latinsk), nepalitska, niueanska, nogay, nordsamiska (latinsk), norska, occitanska, ossetiska, pashto, persiska, polska, portugisiska, punjabi (arabiska), ripuarianska, rumänska, rätoromanska, ryska, sadri (devanagiri), samoanska (latinsk), sanskrit (devanagari), santali (devanagiri), skotska, skotsk gäliska, serbiska (latinsk), sherpa (devanagiri), sirmauri (devanagiri), skoltsamiska, slovakiska, slovenska, somaliska (arabiska), sydsamiska, spanska, swahili (latinsk), svenska, tadzjikiska (kyrilliska), tatariska (latinsk), tetum, thangmi, tonganska, turkmenska (latinsk), tuvan, högsorbiska, urdu, uiguriska (arabiska), uzbekiska (arabiska), uzbekiska (kyrilliska), uzbekiska (latinsk), volapük, valser, walesiska, västfrisiska, yucatecmaya, zhuang, zulu
- Språk för handskriven text: engelska, kinesiska (förenklad), franska, tyska, italienska, japanska, koreanska, portugisiska, spanska
- bild:
- JPG
- PNG
- BMP
- Storlek: 20 MB max
- För PDF-dokument bearbetas endast de första 2,000 sidorna.
Modell-utdata
Om ett dokument identifieras, kommer textigenkänningsmodellen att visa följande information:
- Resultat: En lista med rader som extraherats från indatatexten.
- Text: Strängar som innehåller den identifierade textraden.
- BoundingBox: Fyra värden som representerar avgränsningsrutan, som beskrivs med hjälp av de övre och vänstra positionerna tillsammans med dess bredd och höjd.
Gränser
Åtgärd | Gräns | Förnyelseperiod |
---|---|---|
Textidentifieringssamtal (per miljö) | 480 | 60 sekunder |