Inbyggd modell för textidentifiering

Artikel
12/09/2024

Den inbyggda textigenkänningsmodellen kan extrahera identifierade ord från dokument och bilder till maskinläsbara teckenströmmar. Den använder OCR (optisk teckenläsning) till att identifiera tryckt och handskriven text i bilder.

Denna modell bearbetar bilder och dokumentfiler för att extrahera rader med tryckt eller handskriven text.

Används i Power Apps

Den fördefinierade textigenkänningsmodellen är tillgänglig i Power Apps via textigenkänningskomponenten. Mer information: Använda textigenkänningskomponenten i Power Apps

Används i Power Automate

Information om hur du använder den här modellen i Power Automate finns i Använda den fördefinierade modellen för textidentifiering i Power Automate.

Språk, format och storlek som stöds

De filer som du kan skanna med textigenkänningsmodellen måste ha följande egenskaper:

Språk för tryckt text: afrikaans, albanska, angika (devanagiri), arabiska, asturiska, awadhi-hindi (devanagiri), azerbajdzjanska (latinsk), bagheli, baskiska, vitryska (kyrilliska), vitryska (latinsk), bhojpuri-hindi (devanagiri), bislama, bodó (devanagiri), bosniska (latinsk), brajbha, bretonska, bulgariska, bundeli, burjatiska (kyrilliska), katalanska, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinesiska (förenklad), kinesiska (traditionell), korniska, korsikanska, krimtatariska (latinsk), kroatiska, tjeckiska, Danska, dari, dhimal (devanagiri), dogri (devanagiri), nederländska, engelska, erzya (kyrillisk), estniska, färöiska, fijianska, filippinska, finska, franska, friuliska, gagauz (latinsk), galiciska, tyska, gilbertesiska, gondi (devanagiri), grönländska, gurung (devanagiri), haitisk kreol, halbi (devanagiri), hani, haryanvi, hawaiianska, hindi, hmong daw (latinsk), ho (devanagiri), ungerska, isländska, inarisamiska, indonesiska, interlingua, inuktitut (latin), irländska, italienska, japanska, jaunsari (devanagiri), javanesiska, Kabuverdianu, Kachin (latinsk), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latinsk), kasjubiska, kazakiska (kyrillisk), kazakiska (latinsk), Khaling, Khasi, K'iche', koreanska, Korku, Koryak, kosraeanska, Kumyk (kyrilliska), kurdiska (arabiska), kurdiska (latin), kurukh (devanagiri), kirgiziska (kyrilliska), lakota, latin, litauiska, lågsorbiska, lulesamiska, luxemburgiska, Mahasu Pahari (Devanagiri), malajiska (latin), maltesiska, maltesiska, malto (devanagiri), manx, maori, marathi, mongoliska (kyrilliska), Montenegrinska (kyrilliska), montenegrinska (latinsk), nepalitska, niueanska, nogay, nordsamiska (latinsk), norska, occitanska, ossetiska, pashto, persiska, polska, portugisiska, punjabi (arabiska), ripuarianska, rumänska, rätoromanska, ryska, sadri (devanagiri), samoanska (latinsk), sanskrit (devanagari), santali (devanagiri), skotska, skotsk gäliska, serbiska (latinsk), sherpa (devanagiri), sirmauri (devanagiri), skoltsamiska, slovakiska, slovenska, somaliska (arabiska), sydsamiska, spanska, swahili (latinsk), svenska, tadzjikiska (kyrilliska), tatariska (latinsk), tetum, thangmi, tonganska, turkmenska (latinsk), tuvan, högsorbiska, urdu, uiguriska (arabiska), uzbekiska (arabiska), uzbekiska (kyrilliska), uzbekiska (latinsk), volapük, valser, walesiska, västfrisiska, yucatecmaya, zhuang, zulu
Språk för handskriven text: engelska, kinesiska (förenklad), franska, tyska, italienska, japanska, koreanska, portugisiska, spanska
bild:
- JPG
- PNG
- BMP
- PDF
Storlek: 20 MB max
För PDF-dokument bearbetas endast de första 2,000 sidorna.

Modell-utdata

Om ett dokument identifieras, kommer textigenkänningsmodellen att visa följande information:

Resultat: En lista med rader som extraherats från indatatexten.
Text: Strängar som innehåller den identifierade textraden.
BoundingBox: Fyra värden som representerar avgränsningsrutan, som beskrivs med hjälp av de övre och vänstra positionerna tillsammans med dess bredd och höjd.

Gränser

Åtgärd	Gräns	Förnyelseperiod
Textidentifieringssamtal (per miljö)	480	60 sekunder

Utbildning: Identifiera text med AI Builder (modul)

Dela via

Inbyggd modell för textidentifiering

Används i Power Apps

Används i Power Automate

Språk, format och storlek som stöds

Modell-utdata

Gränser

Feedback

Ytterligare resurser

Dela via

Inbyggd modell för textidentifiering

Används i Power Apps

Används i Power Automate

Språk, format och storlek som stöds

Modell-utdata

Gränser

Relaterad information

Feedback

Ytterligare resurser