Freigeben über


Vordefiniertes Texterkennungsmodell

Das vordefinierte Texterkennungsmodell extrahiert Wörter aus Dokumenten und Bildern in maschinell lesbare Zeichenströme. Verwendet wird dabei hochmoderne optische Zeichenerkennung (OCR), um in Bildern gedruckten und handgeschriebenen Text zu ermitteln.

Dieses Modell verarbeitet Bilder und Dokumentdateien, um die Zeilen des gedruckten oder handgeschriebenen Texts zu extrahieren.

In Power Apps verwenden

Das vordefinierte Texterkennungsmodell ist in Power Apps mithilfe der Texterkennungskomponente verfügbar. Weitere Informationen: Verwenden der Texterkennungskomponente in Power Apps

In Power Automate verwenden

Informationen zur Verwendung dieses Modells in Power Automate erhalten Sie unter Das vordefinierte Modell zur Texterkennung in Power Automate verwenden.

Unterstützte Sprache, Format und Größe

Die Dateien, die Sie mit dem Texterkennungsmodell überprüfen können, müssen diese Eigenschaften haben:

  • Sprache für gedruckte Texte: Afrikaans, Albanisch, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Aserbaidschanisch (Latein), Bagheli, Baskisch, Belarussisch (Kyrillisch), Belarussisch (Latein), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Latein), Brajbha, Bretonisch, Bulgarisch, Bundeli, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinesisch (vereinfacht), Chinesisch (traditionell), Kornisch, Korsisch, Krimtatarisch (Latein), Kroatisch, Tschechisch, Dänisch, Dari, Dhimal ( Devanagiri), Dogri (Devanagiri), Niederländisch, Englisch, Erzya (Kyrillisch), Estnisch, Färöisch, Fidschisch, Philippinisch, Finnisch, Französisch, Friaulisch, Gagausisch (Latein), Galizisch, Deutsch, Gilbertesisch, Gondi (Devanagiri), Grönländisch, Gurung (Devanagiri), Haitianisch-Kreolisch, Halbi (Devanagiri), Hani, Haryanvi, Hawaiianisch, Hindi, Hmong Daw (Lateinisch), Ho(Devanagiri), Ungarisch, Isländisch, Inarisamisch, Indonesisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Jaunsari (Devanagiri), Javanisch, Kabuverdianu, Kachin (Latein), Kangri (Devanagiri), Karatschai-Balkar, Kara-Kalpak (Kyrillisch), Kara-Kalpak (Latein), Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Latein), Khaling, Khasi, K'iche', Koreanisch, Korku, Koryak, Kosraean, Kumyk (Kyrillisch), Kurdisch (Arabisch), Kurdisch (Latein), Kurukh (Devanagiri), Kirgisisch (Kyrillisch), Lakota, Latein, Litauisch, Niedersorbisch, Lulesamisch, Luxemburgisch, Mahasu Pahari (Devanagiri), Malaiisch (Latein), Maltesisch, Malto (Devanagiri), Manx, Maori, Marathi, Mongolisch (Kyrillisch). ), Montenegrinisch (Kyrillisch), Montenegrinisch (Lateinisch), Neapolitanisch, Nepali, Niueanisch, Nogai, Nordsamisch (Latein), Norwegisch, Okzitanisch, Ossetisch, Paschtu, Persisch, Polnisch, Portugiesisch, Punjabi (Arabisch), Ripuarisch, Rumänisch, Rätoromanisch, Russisch, Sadri (Devanagiri), Samoanisch (Latein), Sanskrit (Devanagari), Santali (Devanagiri), Schottisch, Schottisch-Gälisch, Serbisch (Latein), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slowakisch, Slowenisch, Somali (Arabisch), Südsamisch, Spanisch, Suaheli (Latein), Schwedisch, Tadschikisch (Kyrillisch), Tatarisch (Latein), Tetum, Thangmi, Tongaisch, Türkisch, Turkmenisch (Latein), Tuwinisch, Obersorbisch, Urdu, Uigurisch (Arabisch), Usbekisch (Arabisch), Usbekisch (Kyrillisch), Usbekisch (Latein), Volapük, Walser, Walisisch, Westfriesisch, Yukatekisches Maya, Zhuang, Zulu
  • Sprache für handschriftlichen Text: Englisch, Chinesisch (vereinfacht), Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Spanisch
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Größe: maximal 20 MB
  • Bei PDF-Dokumenten werden nur die ersten 2,000 Seiten verarbeitet.

Modellausgabe

Wenn ein Dokument erkannt wird, gibt das Texterkennungsmodell die folgenden Informationen aus:

  • Ergebnisse: Eine Liste von Zeilen, die aus dem Eingabetext extrahiert wurden.
  • Text: Zeichenfolgen, die die erkannte Textzeile enthalten.
  • BoundingBox: Vier Werte, die den Begrenzungsrahmen darstellen, beschrieben durch die obere und linke Position sowie seine Breite und Höhe.

Grenzwerte

Aktion Limit Erneuerungszeitraum
Aufruf der Texterkennung (pro Umgebung) 480 60 Sekunden

Training: Text mit AI Builder erkennen (Modul)