Dela via


Inbyggd modell för textidentifiering

Den inbyggda textigenkänningsmodellen kan extrahera identifierade ord från dokument och bilder till maskinläsbara teckenströmmar. Den använder OCR (optisk teckenläsning) till att identifiera tryckt och handskriven text i bilder.

Denna modell bearbetar bilder och dokumentfiler för att extrahera rader med tryckt eller handskriven text.

Används i Power Apps

Den fördefinierade textigenkänningsmodellen är tillgänglig i Power Apps via textigenkänningskomponenten. Mer information: Använda textigenkänningskomponenten i Power Apps

Används i Power Automate

Information om hur du använder den här modellen i Power Automate finns i Använda den fördefinierade modellen för textidentifiering i Power Automate.

Språk, format och storlek som stöds

De filer som du kan skanna med textigenkänningsmodellen måste ha följande egenskaper:

  • Språk för tryckt text: afrikaans, albanska, angika (devanagiri), arabiska, asturiska, awadhi-hindi (devanagiri), azerbajdzjanska (latinsk), bagheli, baskiska, vitryska (kyrilliska), vitryska (latinsk), bhojpuri-hindi (devanagiri), bislama, bodó (devanagiri), bosniska (latinsk), brajbha, bretonska, bulgariska, bundeli, burjatiska (kyrilliska), katalanska, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinesiska (förenklad), kinesiska (traditionell), korniska, korsikanska, krimtatariska (latinsk), kroatiska, tjeckiska, Danska, dari, dhimal (devanagiri), dogri (devanagiri), nederländska, engelska, erzya (kyrillisk), estniska, färöiska, fijianska, filippinska, finska, franska, friuliska, gagauz (latinsk), galiciska, tyska, gilbertesiska, gondi (devanagiri), grönländska, gurung (devanagiri), haitisk kreol, halbi (devanagiri), hani, haryanvi, hawaiianska, hindi, hmong daw (latinsk), ho (devanagiri), ungerska, isländska, inarisamiska, indonesiska, interlingua, inuktitut (latin), irländska, italienska, japanska, jaunsari (devanagiri), javanesiska, Kabuverdianu, Kachin (latinsk), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillisk), Kara-Kalpak (latinsk), kasjubiska, kazakiska (kyrillisk), kazakiska (latinsk), Khaling, Khasi, K'iche', koreanska, Korku, Koryak, kosraeanska, Kumyk (kyrilliska), kurdiska (arabiska), kurdiska (latin), kurukh (devanagiri), kirgiziska (kyrilliska), lakota, latin, litauiska, lågsorbiska, lulesamiska, luxemburgiska, Mahasu Pahari (Devanagiri), malajiska (latin), maltesiska, maltesiska, malto (devanagiri), manx, maori, marathi, mongoliska (kyrilliska), Montenegrinska (kyrilliska), montenegrinska (latinsk), nepalitska, niueanska, nogay, nordsamiska (latinsk), norska, occitanska, ossetiska, pashto, persiska, polska, portugisiska, punjabi (arabiska), ripuarianska, rumänska, rätoromanska, ryska, sadri (devanagiri), samoanska (latinsk), sanskrit (devanagari), santali (devanagiri), skotska, skotsk gäliska, serbiska (latinsk), sherpa (devanagiri), sirmauri (devanagiri), skoltsamiska, slovakiska, slovenska, somaliska (arabiska), sydsamiska, spanska, swahili (latinsk), svenska, tadzjikiska (kyrilliska), tatariska (latinsk), tetum, thangmi, tonganska, turkmenska (latinsk), tuvan, högsorbiska, urdu, uiguriska (arabiska), uzbekiska (arabiska), uzbekiska (kyrilliska), uzbekiska (latinsk), volapük, valser, walesiska, västfrisiska, yucatecmaya, zhuang, zulu
  • Språk för handskriven text: engelska, kinesiska (förenklad), franska, tyska, italienska, japanska, koreanska, portugisiska, spanska
  • bild:
    • JPG
    • PNG
    • BMP
    • PDF
  • Storlek: 20 MB max
  • För PDF-dokument bearbetas endast de första 2,000 sidorna.

Modell-utdata

Om ett dokument identifieras, kommer textigenkänningsmodellen att visa följande information:

  • Resultat: En lista med rader som extraherats från indatatexten.
  • Text: Strängar som innehåller den identifierade textraden.
  • BoundingBox: Fyra värden som representerar avgränsningsrutan, som beskrivs med hjälp av de övre och vänstra positionerna tillsammans med dess bredd och höjd.

Gränser

Åtgärd Gräns Förnyelseperiod
Textidentifieringssamtal (per miljö) 480 60 sekunder

Utbildning: Identifiera text med AI Builder (modul)